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编译 原理 第 2 版 


本 书 是 编译 领域 无 可 替代 的 经 典 著作 ， 被 广大 计算 机 专业 人 士 誉 为 “ 龙 书 ”。 本 书 上 一 版 自 
1986 年 出 版 以 来 ， 被 世界 各 地 的 著名 高 等 院 校 和 研究 机 构 (包括 美国 哥伦比亚 大 学 、 斯 坦 福 大 
学 、 哈 佛 大 学 、 普 林 斯 顿 大 学 、 贝 尔 实验 室 ) 作为 本 科 生 和 研究 生 的 编译 原理 课程 的 教材 。 该 书 
对 我 国 高 等 计算 机 教育 领域 也 产生 了 重大 影响 。 

第 2 版 对 每 一 章 都 进行 了 全 面 的 修订 ， 以 反映 自 上 一 版 出 版 20 多 年 来 软件 工程 、 程 序 设计 语 
言 和 计算 机 体系 结构 方面 的 发 展 对 编译 技术 的 影响 。 本 书 全 面 介绍 了 编译 器 的 设计 ， 并 强调 编译 
技术 在 软件 设计 和 开发 中 的 广泛 应 用 。 每 章 中 都 包含 大 量 的 习题 和 丰富 的 参考 文献 。 

本 书 适 合作 为 高 等 院 校 计算 机 专业 本 科 生 和 研究 生 的 编译 原理 与 技术 课程 的 教材 ， 也 可 供 广 
大 计算 机 技术 人 员 人 参考。 
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编译 器 、 数 据 库 系统 及 计算 机 科学 基础 方面 的 著作 。 
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产生 了 最 流行 的 研究 用 编译 器 之 一 。 
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本 书 全 面 . 深 入 地 探讨 了 编译 器 设计 方面 的 重要 主题 , 包括 词法 分 析 、 语法 分 析 、 语法 制导 
定义 和 语法 制导 翻译 、 运 行 时 刻 环境 、 目标 代码 生成 、 代 码 优 化 技术 、 并 行 性 检测 以 及 过 程 间 
分 析 技 术 , 并 在 相关 章节 中 给 出 大 量 的 实例 。 与 上 一 版 相 比 , 本 书 进行 了 全 面 修订 , 涵盖 了 编 
译 器 开发 方面 最 新 进展 。 每 章 中 都 提供 了 大 量 的 实例 及 参考 文献 。 

本 书 是 编译 原理 课程 方面 的 经 典 教材 ,内 容 丰 富 , 适合 作为 高 等 院 校 计算 机 及 相关 专业 本 
科 生 及 研究 生 的 编译 原理 课程 的 教材 , 也 是 广大 技术 人 员 的 极 佳 参考 读物 。 
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文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 董 断 性 的 优势 ;也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 ,在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 豆 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 分 社 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 华 章 分 社 就 
将 工作 重点 放 在 了 遂 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良好 
的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry 
L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 了 珍藏。 大理石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书” 的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 襄 助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,，“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 分 社 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 ] 号 
邮政 编码 : 100037 








SERA) AE EAE FA ETB OR Sa SY), HAEA A a S A ET Sin PE 
的 编译 ,才能 转换 为 可 以 在 计算 机 上 运行 的 机 器 代码 。 编 译 器 所 生成 代码 的 正确 性 和 质量 会 直 
接 影响 成 千 上 万 个 软件 。 因 此 , 编译 器 构造 原理 和 技术 是 计算 机 科学 技术 领域 中 的 一 个 非常 重 
要 的 组 成 部 分 。 不 仅 如 此 , 编译 技术 在 当前 已 经 广泛 应 用 于 编译 器 构造 之 外 的 其 他 领域 ,比如 程 
序 分 析 / 验 证 、 模型 转换 、 语 言 处 理 等 领域 。 因 此 , 虽然 大 部 分 读者 不 会 参与 设计 商用 编译 器 , 但 
拥有 编译 的 相关 知识 仍然 会 对 他 们 的 研究 开发 生涯 产生 有 益 的 影响 。 

A. V. Aho 等 人 撰写 的 《Compilers: Principles, Techniques, and Tools》 被 誉 为 编译 教科 书 中 的 
“ 龙 书 ”。 这 说 明 这 本 书 具 有 很 高 的 权威 性 。 我 们 有 幸 受 机 械 工 业 出 版 社 的 委托 , 翻译 龙 书 的 第 2 
版 。 

本 书 不 仅 包含 了 词法 分 析 、 语法 分 析 、 语义 分 析 、 代 码 生成 等 传统 、 经 典 的 编译 知识 , 还 详 
细 介 绍 了 一 些 最 新 研究 成 果 ， 比如 过 程 间 指 针 分 析 的 最 新 进展 。 这 使 得 本 书 不 仅 适 用 于 编译 原 
理 的 初学 者 ,还 可 以 作为 研究 人 员 的 参考 书目 。 本 书 不 仅 介绍 编译 器 构造 的 基本 原理 和 技术 ,还 
详细 介绍 一 些 有 用 的 编译 器 构造 工具 ， 比如 对 Lex 和 Yace 的 介绍 使 得 读者 可 以 了 解 这 些 工具 的 
工作 原理 和 使 用 方法 。 除 此 之 外 , 读者 还 可 以 看 到 很 多 其 他 领域 的 概念 在 编译 器 构造 中 的 应 用 。 
比如 在 第 9 章 , 读者 可 以 看 到 群 论 中 的 抽象 概念 “ 格 ” 被 完美 地 应 用 于 数据 流 分 析 算 法 的 设计 。 
而 在 第 11 章 , 线性 规划 和 整数 规划 技术 被 成 功 地 应 用 于 程序 并 行 化 技术 。 这 些 内 容 对 拓展 读者 
的 视野 和 思路 有 很 大 的 好 处 。 

由 于 本 书 覆 盖 的 范围 非常 广 , 不 可 能 在 一 个 学 期 内 讲 完 本 书 的 全 部 内 容 。 因 此 我 建议 采用 
本 书 作为 本 科 生 教材 的 老师 只 选择 讲授 其 中 的 基础 部 分 , 即 第 1 章 到 第 9 章 中 的 大 部 分 内 容 。 第 
2 章 是 对 后 面 各 章 内 容 的 介绍 , 可 以 在 讲授 相应 内 容 之 前 指导 学 生 预 习 。 

最 后 感谢 机 械 工业 出 版 社 的 温 莉 芳 女 士 以 及 姚 蔷 和 朱 支 两 位 编辑 在 本 书 的 翻译 过 程 中 给 予 
我 们 的 有 力 帮 助 , 也 感谢 其 他 给 予 我 们 支持 的 同事 。 由 于 水 平 有 限 , 翻译 中 的 错漏 之 处 在 所 难 
免 ， 欢迎 读者 批评 指正 。 


译 者 
2008 年 6 月 于 南京 





从 本 书 的 1986 版 出 版 到 现在 , 编译 器 设计 领域 已 经 发 生 了 很 大 的 改变 。 随 着 程序 设计 语言 
的 发 展 ， 提 出 了 新 的 编译 问题 。 计 算 机 体系 结构 提供 了 多 种 多 样 的 资源 ， 而 编译 器 设计 者 必须 能 
够 充分 利用 这 些 资 源 。 最 有 意思 的 事情 可 能 是 , 古老 的 代码 优化 技术 已 经 在 编译 器 之 外 找到 了 
新 的 应 用 。 现 在 ; 有 些 工 具 利用 这 些 技 术 来 寻找 软件 中 的 缺陷 , 以 及 (最 重要 的 是 ) 寻找 现 有 代 
码 中 的 安全 漏洞 。 而 且 , 很 多 “前 端 " 技术 一 一 文法 、 正 则 表达 式 、 语 法 分 析 器 以 及 语法 制导 翻译 
器 等 一 一 仍然 被 广泛 应 用 。 

因此 , 本 书 先前 的 版 本 所 体现 的 我 们 的 价值 观 一 直 没 有 改变 。 我 们 知道 ,只 有 很 少 的 读者 将 
会 去 构建 甚至 维护 一 个 主流 程序 设计 语言 的 编译 器 。 但 是 ， 和 编译 器 相关 的 模型 、 理论 和 算法 可 
以 被 应 用 到 软件 设计 和 开发 中 出 现 的 各 种 各 样 的 问题 上 。 因 此 , 我 们 会 关注 那些 在 设计 一 个 语 
言 处 理 器 时 常常 会 碰 到 的 问题 ， 而 不 考虑 具体 的 源 语言 和 目标 机 器 究竟 是 什么 。 


使 用 本 书 


要 学 完 本 书 的 全 部 或 大 部 分 内 容 至 少 需要 两 个 学 季 ( quarter) , 甚至 两 个 学 期 (semester) 昌 。 
通常 会 在 一 门 本 科 课 程 中 讲授 本 书 的 前 半 部 分 内 容 ; 而 本 书 的 后 半 部 分 (强调 代码 优化 ) 会 在 研 
究 生 层面 或 另 一 门 小 范围 的 课程 中 讲授 。 下 面 是 各 章 的 概要 介绍 : 

。 第 1 章 给 出 一 些 关于 学 习 动 机 的 资料 , 同时 也 将 给 出 一 些 关 于 计算 机 体系 结构 和 程序 设 
计 语 言 原则 的 背景 知识 。 

第 2 章 会 开发 一 个 小 型 的 编译 器 , 并 介绍 很 多 重要 概念 。 这 些 概 念 将 在 后 面 的 各 章 中 深 

入 介绍 。 这 个 编译 器 本 身 将 在 附录 中 给 出 。 

第 3 章 将 讨论 词法 分 析 、 正则 表达 式 、 有 穷 状态 自动 机 和 词法 分 析 器 的 生成 器 工具 。 这 

些 内 容 是 各 种 文本 处 理 的 基础 。 

第 4 章 将 讨论 主流 的 语法 分 析 方 法 , 包括 自 顶 向 下 方法 (递归 下 降 法 、LL 技术 ) 和 自 底 向 

上 方法 (LR 技术 和 它 的 变 体 ) 。 

e 第 5 章 将 介绍 语法 制导 定义 和 语法 制导 翻译 的 基本 思想 。 

。 第 6 章 将 使 用 第 5 章 中 的 理论 , 并 说 明 如 何 使 用 这 些 理论 为 一 个 典型 的 程序 设计 语言 生 
成 中 间 代 码 。 

© 第 7 章 将 讨论 运行 时 刻 环境 ; 特别 是 运行 时 刻 栈 的 管理 和 垃圾 回收 机 人 制 。 

o 第 8 章 将 主要 讨论 目标 代码 生成 技术 。 该 章 会 讨论 基本 块 的 构造 , 从 表达 式 和 基本 块 生 
成 代码 的 方法 , 以 及 寄存 器 分 配 技 术 。 

o 第 9 章 将 介绍 代码 优化 技术 , 包括 流 图 、 数 据 流 分 析 框 架 以 及 求解 这 些 框 架 的 迭代 算法 。 





O 美国 大 学 的 学 制 大 致 可 以 分 为 两 种 : quarter( 学 季 ) 和 semester( 学 期 )。 前 者 是 把 一 年 分 为 4 个 quarter, 每 个 quar- 
ter3 个 月 , 原则 上 是 上 3 个 quarter 修一 个 quarter 的 假 ; 而 后 者 则 类 似 我 国 国内 的 寒暑 假 制 的 大 学 学 制 , 大 概 4 个 
编辑 注 





月 一 个 semester。 


Vl 


e 第 10 章 将 讨论 指令 级 优化 。 该 章 的 重点 是 从 小 段 指令 代码 中 抽取 并 行 性 , 并 在 那些 可 以 

同时 做 多 件 事情 的 单 处 理 器 上 调度 这 些 指令 。 

。 第 11 章 将 介绍 大 规模 并 行 性 的 检测 和 利用 。 这 里 的 重点 是 数值 计算 代码 。 这 些 代码 具有 

对 多 维 数组 进行 遍历 的 紧 致 循环 。 
。 第 12 章 将 介绍 过 程 间 分 析 技 术 。 它 将 讨论 指针 分 析 、 别 名 和 数据 流 分 析 。 这 些 分 析 都 考 
虑 了 到 达 代 码 中 某 个 给 定点 时 的 过 程 调用 序列 。 

哥伦比亚 大 学 、 哈 佛 大 学 、 斯 坦 福 大 学 已 经 开设 了 讲授 本 书 内 容 的 课程 。 哥 伦比 亚 大 学 定期 
开设 一 门 关于 程序 设计 语言 和 翻译 器 的 课程 , 使 用 了 本 书 前 8 章 的 内 容 。 该 课程 常年 面向 高 年 级 
本 科 生 /一 年 级 研究 生 讲授 , 这 门 课程 的 亮点 是 一 个 长 达 一 个 学 期 的 课程 实践 项 目 。 在 该 项 目 
中 , 学 生 分 成 小 组 ,创建 并 实现 一 个 他 们 自己 设计 的 小 型 语言 。 学 生 创 建 的 语言 涉及 多 个 应 用 领 
域 , 包括 量子 计算 、 音乐 合 成 、 计算机 图 形 学 、 游戏、 矩阵 运算 和 很 多 其 他 领域 。 在 构建 他 们 目 
己 的 编译 器 时 , 学 生 们 使 用 了 很 多 种 可 以 生成 编译 器 组 件 的 工具 ,比如 ANTLR, Lex 和 Yacc; 他 
们 还 使 用 了 第 2 章 和 第 5 章 中 讨论 的 语法 制导 翻译 技术 。 后 续 的 研究 生 课程 的 重点 是 本 书 第 9 
章 到 第 12 章 的 内 容 , 着 重 强调 适用 于 当代 计算 机 (包括 网 络 处 理 器 和 多 处 理 器 体系 结构 ) 的 代码 
生成 和 优化 技术 。 

斯 坦 福 大 学 开设 了 一 门 历时 一 个 学 季 的 入 门 课程 , 大 致 涵盖 了 本 书 第 1 章 到 第 8 章 的 内 容 ， 
同时 还 会 简介 本 书 第 9 章 中 全 局 代码 优化 的 相关 内 容 。 第 二 门 编译 器 课程 包括 本 书 第 9 章 到 第 
12 章 的 内 容 , 另外 还 包括 第 7 章 中 更 为 深入 的 有 关 垃 圾 收集 的 内 容 。 学 生 使 用 一 个 该 校 开 发 的 、 
基于 Java 的 系统 Joeq 来 实现 数据 流 分 析 算 法 。 


预备 知识 

学 习 本 书 的 读者 应 该 拥有 一 些 “ 计 算 机 科学 的 综合 知识 ”, 至 少 学 过 两 门 程序 设计 课程 ,以 
及 数据 结构 和 离散 数学 的 课程 。 具 备 多 种 程序 设计 语言 的 知识 对 学 习 本 书 会 有 所 帮助 。 
练习 

本 书包 含 内 容 广泛 的 练习 ,几乎 每 一 节 都 有 一 些 练习 。 我 们 用 感叹 号 来 表示 较 难 的 练习 或 
练习 中 的 一 部 分 。 难 度 最 大 的 练习 有 两 个 感叹 号 。 
万 维 网 上 的 支持 


在 本 书 的 主页 (http ://dragonbook. stanford. edu)S 上 可 以 找到 本 书 已 知 错误 的 勘误 表 以 及 一 
些 支 持 性 资料 。 我 们 希望 将 我 们 讲授 的 每 一 门 与 编译 器 相关 的 课程 的 可 用 讲义 (包括 家 庭 作 
业 、 答案 和 练习 等 ) 都 提供 出 来 。 我 们 也 计划 公布 由 一 些 重要 编译 器 的 作者 撰写 的 关于 这 些 编 
译 右 的 描述 。 
致谢 

本 书 封 面 由 Strange Tonic Productions 的 S. D. Ullman 设计 。 


Jon Bentley 针对 本 书 的 初稿 中 的 多 章 内 容 与 我 们 进行 了 广泛 深入 的 讨论 。 我 们 收 到 了 来 
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Sle 5. i 


程序 设计 语言 是 向 人 以 及 计算 机 描述 计算 过 程 的 记号 。 如 我 们 所 知 , 这 个 世界 依赖 于 程序 
设计 语言 , 因为 在 所 有 计算 机 上 运行 的 所 有 软件 都 是 用 某 种 程序 设计 语言 编写 的 。 但 是 , 在 一 个 
程序 可 以 运行 之 前 , 它 首先 需要 被 翻译 成 一 种 能 够 被 计算 机 执行 的 形式 。 

完成 这 项 翻译 工作 的 软件 系统 称 为 编译 器 ( compiler) 。 

本 书 介绍 的 是 设计 和 实现 编译 器 的 方法 。 我 们 将 介绍 用 于 构建 面向 多 种 语言 和 机 器 的 翻译 
器 的 一 些 基本 思想 。 编 译 器 设计 的 原理 和 技术 还 可 以 用 于 编译 器 设计 之 外 的 众多 领域 。 因 此 ， 
这 些 原理 和 技术 通常 会 在 一 个 计算 机 科学 家 的 职业 生涯 中 多 次 被 用 到 。 研 究 编译 器 的 编写 将 涉 
及 程序 设计 语言 、 计 算 机 体系 结构 、 形 式 语言 理论 、 算 法 和 软件 工程 。 

在 本 章 中 , 我 们 将 介绍 语言 翻译 器 的 不 同形 式 , 在 高 层次 上 概述 一 个 典型 编译 器 的 结构 ， 
并 讨论 了 程序 设计 语言 和 硬件 体系 结构 的 发 展 趋势 。 这 些 趋 势 将 影响 编译 器 的 形式 。 我 们 还 
将 介绍 关于 编译 器 设计 和 计算 机 科学 理论 的 关系 的 一 些 事实 , 并 给 出 编译 技术 在 编译 领域 之 
外 的 一 些 应 用 。 最 后 , 我 们 将 简单 论述 在 我 们 研究 编译 器 时 需要 用 到 的 重要 的 程序 设计 语言 
概念 。 





1.1 BELEE 
简单 地 说 , 一 个 编译 器 就 是 一 个 程序 , 它 可 以 阅读 以 某 一 种 语言 ( 源 语言 ) 编写 的 程序 , 并 把 
该 程序 翻译 成 为 一 个 等 价 的 、 用 另 一 种 语言 ( 目标 语言 ) 编写 的 程序 ,人 参见 源 程序 
图 1-1。 编 译 器 的 重要 任务 之 一 是 报告 它 在 翻译 过 程 中 发 现 的 源 程序 中 的 
错误 。 编译 器 


如 果 目 标 程序 是 一 个 可 执行 的 机 器 语言 程序 ,那么 它 就 可 以 被 用 户 调 
用 ,处 理 输 入 并 产生 输出 。 参 见 图 12。 

解释 器 (interpreter) 是 另 一 种 常见 的 语言 处 理 器 。 它 并 不 通过 翻译 的 方 图 1-1 一 个 编译 器 
式 生成 目标 程序 。 从 用 户 的 角度 看 , 解释 器 直接 利用 用 户 提供 的 输入 执行 源 程序 中 指定 的 操作 。 
参见 图 13。 

在 把 用 户 输入 映射 成 为 输出 的 过 程 中 ， 直 一 个 编译 器 产生 的 “ 输 和 -| eee | at 
机 器 语言 目标 程序 通常 比 一 个 解释 器 快 很 多 。 然 而 ,解释 器 的 错 ai CI 
误诊 断 效果 通常 比 编译 器 更 好 ， 因 为 它 逐 个 语句 地 执行 源 程序 。 
Java 语言 处 理 器 结合 了 编译 和 解释 过 程 , 如 图 1-4 所 示 。 一 个 Java 源 程序 首先 被 编译 成 
一 个 称 为 字 节 码 (bytecode) 的 中 间 表 示 形 式 。 然 后 由 一 个 虚拟 机 对 得 到 的 字 节 码 加 以 解释 执行 。 这 


样 安排 的 好 处 之 一 是 在 一 台 机 器 上 编译 得 到 的 字 节 码 可 以 在 另 ae 

台 机 器 上 解释 执行 。 通 过 网 络 就 可 以 完成 机 器 之 问 的 迁移 。 ea wm Hs 
为 了 更 快 地 完成 输入 到 输出 的 处 理 , 有 些 被 称 为 好 时 (just 

in time) 编译 器 的 Java 编译 器 在 运行 中 间 程 序 处 理 输入 的 前 一 图 13 一 个 解释 器 

刻 首先 把 字 节 码 翻译 成 为 机 器 语言 然后 再 执 行程 序 。 o 
如 图 1.5 所 示 , 除了 编译 器 之 外 ,创建 一 个 可 执行 的 目标 程序 还 需要 一 些 其 他 程序 。 一 个 源 


目标 程序 
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程序 可 能 被 分 割 成 为 多 个 模块 ， 并 存放 于 独立 的 文件 中 。 把 源 程序 聚合 在 一 起 的 任务 有 时 会 由 
_ 个 被 称 为 预 处 理 器 ( preprocessor) 的 程序 独立 完成 。 预 处 理 需 源 程序 
还 负责 把 那些 称 为 宏 的 缩写 形式 转换 为 源 语言 的 语句 。 

然后 , 将 经 过 预 处 理 的 源 程序 作为 输入 传递 给 一 个 编译 器 =z 
编译 器 可 能 产生 一 个 汇编 诸 言 程序 作为 其 输出 ;因为 汇编 语言 ” 
比较 容易 输出 和 调试 。 接 着 , 这 个 汇编 语言 程序 由 称 为 汇编 器 PA | i | 
(assembler) 的 程序 进行 处 理 , 并 生成 可 重 定位 的 机 器 代码 。 

大 型 程序 经 常 被 分 成 多 个 部 分 进行 编译 , 因此 ， 可 重 定 图 1.4 一 个 混合 编译 器 
位 的 机 器 代码 有 必要 和 其 他 可 重 定位 的 目标 文件 以 及 库 文件 
连接 到 一 起 , 形成 真正 在 机 器 上 运行 的 代码 。 一 个 文件 中 的 源 程序 
代码 可 能 指向 另 一 个 文件 中 的 位 置 , 而 链接 器 (linker) 能够 解 
决 外 部 内 存 地 址 的 问题 2 最 后 ,加载 器 (loader) 把 所 有 的 可 执 : 
行 目标 文件 放 到 内 存 中 执行 。 经 过 预 处 理 的 源 程序 


1. 1 节 的 练习 REOR 
练习 1. 1. 1: 编译 器 和 解释 器 之 间 的 区 别 是 什么 ? 


练习 1. 1. 2: 编译 器 相对 于 解释 器 的 优点 是 什么 ? 解释 。 目标 编程 
器 相对 于 编译 器 的 优点 是 什么 ? 


预 处 理 器 


练习 1.1.3: 在 一 个 语言 处 理 系统 中 , 编译 器 产生 汇编 语 basi 
言 而 不 是 机 器 语言 的 好 处 是 什么 ? 可 重 定位 机 器 代码 

练习 1.1.4: 把 一 种 高 级 语言 | 翻译 成 为 另 一 一 种 高 级 语言 链接 昊 /加 载 器 | XH 
的 编译 器 称 为 源 到 源 ( source-to-source ) A) HE Ai 编译 器 使 可 重 定位 对 象 文件 
用 人 C 语言 作为 目标 语言 有 什么 好 处 ? 目标 机 器 代码 

练习 1. 1.5: 描述 一 下 汇编 器 所 要 完成 的 一 些 任务 。 图 1.5， 二 个 语言 处 理 系统 


1.2 一 个 编译 器 的 结构 


到 现在 为 止 , 我 们 把 编译 器 看 作 一 个 黑 盒子 ， 它 能 够 把 源 程 序 映射 为 在 语义 上 等 价 的 目标 程 
序 。 如 果 把 这 个 盒子 稍微 打开 一 点 ,我 们 就 会 看 到 这 个 映射 过 程 由 两 个 部 分 组 成 : 分 析 部 分 和 综 
合 部 分 。 

DH (analysis) 部 分 把 源 程序 分 解 成 为 多 个 组 成 要 素 ， 并 在 这 些 要 素 之 上 加 上 语法 结构 。 然 
后 , 它 使 用 这 个 结构 来 创建 该 源 程序 的 一 个 中 间 表 示 。 如 果 分 析 部 分 检查 出 源 程序 没有 按照 正 
确 的 语法 构成 , 或 者 语义 上 不 一 致 , 它 就 必须 提供 有 用 的 信息 ,使 得 用 户 可 以 按 此 进行 改正 。 分 
析 部 分 还 会 收集 有 关 源 程序 的 信息 ,并 把 信息 存放 在 一 个 称 为 符号 表 ( symbol table) 的 数据 结构 
中 a 符号 表 将 和 中 间 表 示 形 式 一 起 传送 给 综合 部 分 。 

综合 (synthesis) 部 分 根据 中 间 表 示 和 符号 表 中 的 信息 来 构造 用 户 期 待 的 目标 程序 。 分 析 部 分 
经 常 被 称 为 编译 器 的 前 端 (front end) , 而 综合 部 分 称 为 后 端 (back end) o 

如 果 我 们 更 加 详细 地 研究 编译 过 程 , 会 发 现 它 顺序 执行 了 一 组 步骤 (phase)。 每 个 步 又 把 源 
程序 的 一 种 表示 方式 转换 成 另 一 种 表示 方式 。 一 个 典型 的 把 编译 程序 分 解 成 为 多 个 步 又 的 方式 
如 图 1-6 fia. 在 实践 中 , 多 个 步 又 可 能 被 组 合 在 一 起 ,而 这 些 组 合 在 一 起 的 步骤 之 间 的 中 间 表 
示 不 需要 被 明确 地 构造 出 来 。 存 放 整 个 源 程序 的 信息 的 符号 表 可 由 编译 器 的 各 个 步骤 使 用 。 

有 些 编译 器 在 前 端 和 后 端 之 间 有 一 个 与 机 器 无 关 的 优化 步 又。 这 个 优化 步骤 的 目的 是 在 中 
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间 表 示 之 上 进行 转换 ,以 便 后 端 程序 能 够 生成 更 好 的 目标 程序 。 如 果 基 于 未 经 过 此 优化 步骤 的 


中 间 表 示 来 生成 代码 , 则 代码 的 质量 会 受到 影响 。 字符 流 
因为 优化 是 可 选 的 , 所 以 图 1-6 中 所 示 的 两 个 优化 
步 又 之 一 可 以 被 省 略 。 me 
1.2.1 词法 分 析 

编译 器 的 第 一 个 步骤 称 为 词法 分 析 (lexical 
analysis ) 或 扫描 (scanning) o 词法 分 析 器 读 人 组 成 语法 树 
源 程序 的 字符 流 , 并 且 将 它们 组 织 成 为 有 意义 的 记 
素 (lexeme) 的 序列 。 对 于 每 个 词素 ,词法 分 析 器 产 soe 
生 如 下 形式 的 词法 单元 (token ) 作为 输出 : 

《token-name attribute-value) 符号 表 

这 个 词法 单元 被 传送 给 下 一 个 步骤 ,， 即 语法 分 中 间 表示 形式 
析 。 在 这 个 词法 单元 中 , 第 一 个 分 量 token-name 是 
一 个 由 语法 分 析 步 又 使 用 的 抽象 符号 ,而 第 二 个 分 中 间 表 示 形 式 
量 attribute-value 指向 符号 表 中 关于 这 个 词法 单元 
的 条 目 。 符 号 表 条 目的 信息 会 被 语义 分 析 和 代码 生 : 
成 步 又 使 用 。 目标 机 器 语言 

比如 , 假设 一 个 源 程序 包含 如 下 的 赋值 语句 

position = initial + rate * 60 (I. 1) 目标 机 器 语言 

这 个 赋值 语句 中 的 字符 可 以 组 合成 如 下 词素 ， 
并 映射 成 为 如 下 词法 单元 。 这 些 词法 单元 将 被 传递 图 1-6 一 个 编译 器 的 各 个 步骤 
给 语法 分 析 阶段 。 


1) position 是 一 个 词素 , 被 映射 成 词法 单元 (id, 1), 其 中 id 是 表示 标识 符 (identifier) 的 
抽象 符号 , 而 1 指向 符号 表 中 position 对 应 的 条 目 。 一 个 标识 符 对 应 的 符号 表 条 目 存放 该 标 
识 符 有 关 的 信息 ， 比 如 它 的 名 字 和 类 型 

2) 赋值 符号 = 是 一 个 词素 , 被 映射 成 词法 单元 ( = ) 。 因 为 这 个 词法 单元 不 需要 属性 值 , 所 
以 我 们 省 略 了 第 二 个 分 量 。 也 可 以 使 用 assign 这 样 的 抽象 符号 作为 词法 单元 的 名 字 , 但 是 为 了 
标记 上 的 方 使 , 我 们 选择 使 用 词素 本 身 作为 抽象 符号 的 名 字 。 

3) initial 是 一 个 词素 , 被 映射 成 词法 单元 (id, 2), 其 中 2 指向 initial 对 应 的 符号 表 
条 目 。 | 

4) + 是 一 个 词素 , 被 映射 成 词法 单元 (+ )。 

5) rate 是 一 个 词素 , 被 映射 成 词法 单元 (id, 3), 其 中 3 指向 rate 对 应 的 符号 表 条 目 。 

6) * 是 一 个 词素 , 被 映射 成 词法 单元 ( * 〉 o 

7) 60 是 一 个 词素 , 被 映射 成 词法 单元 (60〉。 

分 隔 词素 的 空格 会 被 词法 分 析 器 忽略 掉 。 

图 1-7 给 出 经 过 词法 分 析 之 后 ,赋值 语句 1. 1 被 表示 成 如 下 的 词法 单元 序列 : 

(id, 1) (=) (id, 2) (+) (id, 3) ( *) (60) (1,2) 

在 这 个 表示 中 , 词法 单元 名 = 、+ 和 * 分 别 是 表示 赋值 、 加 法 运算 符 、 乘 法 运算 符 的 抽象 符号 。 


O 从 技术 上 讲 , 我 们 应 该 为 语法 单元 60 建立 一 个 形 如 (namber, 4) 的 词法 单元 ， 其 中 4 指向 符号 表 中 对 应 于 整数 60 
的 条 目 。 但 是 我 们 要 到 第 2 章 中 才 讨论 数字 的 词法 单元 。 第 3 章 将 讨论 建立 词法 分 析 器 的 技术 。 











词法 分 析 器 
(id, 1) (=) (id, 2) (+) (id,3) (*) (60) 
语法 分 析 器 
aan = 
| [position] =|] GA OF on a i 
2 [initial | | (id, 3) 60 
3 [rate | _| 
: dy Te 
k (a ee 
(id, i inttofloat 
60 
中 间 代 码 生成 器 


ti = inttofloat(60) 
t2 = id3 * ti 

t3 = id2 + tZ 

idi = t3 


代码 优化 器 


tl = id3 * 60.0 
idi = id2 + ti 


Lo ee | 


ADDF R1, Ri, R2 
STF idi, Ri 


图 1-7 一 个 赋值 语句 的 翻译 


1.22 ,语法 分 析 

编译 器 的 第 2 个 步 又 称 为 语法 分 析 ( syntax analysis ) 或 解析 (parsing)。 语 法 分 析 器 使 用 由 词 
法 分 析 器 生成 的 各 个 词法 单元 的 第 一 个 分 量 来 创建 树 形 的 中 间 表 示 。 该 中 间 表 示 给 出 了 词法 分 
析 产 生 的 词法 单元 流 的 语法 结构 。 一 个 常用 的 表示 方法 是 语法 树 (syntax tree), 树 中 的 每 个 内 部 
结 点 表示 一 个 运算 , 而 该 结 点 的 子 结 点 表示 该 运算 的 分 量 。 在 图 1-7 中 , 词法 单元 流 (1.2) 对 应 
的 语法 树 被 显示 为 语法 分 析 器 的 输出 。 

这 棵 树 显 示 了 赋值 语句 

position = initial + rate * 60 
中 各 个 运算 的 执行 顺序 。 这 棵 树 有 一 个 标号 为 # 的 内 部 结 点 ，< id, 3 > 是 它 的 左 子 结 点 , 整数 60 
是 它 的 右 子 结 点 。 结 点 <id, 3 > 表示 标识 符 rate。 标 号 为 * 的 结 点 指明 了 我 们 必须 首先 把 rate 
的 值 与 60 相 乘 。 标 号 为 + 的 结 点 表明 我 们 必须 把 相 乘 的 结果 和 initial 的 值 相 加 。 这 棵 树 的 根 
结 点 的 标号 为 =， 它 表明 我 们 必须 把 相 加 的 结果 存储 到 标识 符 position 对 应 的 位 置 上 去 。 这 个 运 
算 顺 序 和 通常 的 算术 规则 相同 ,， 即 乘法 的 优先 级 高 于 加 法 ,因此 乘法 应 该 在 加 法 之 前 计算 。 

编译 器 的 后 续 步 又 使 用 这 个 语法 结构 来 帮助 分 析 源 程序 , 并 生成 目标 程序 。 在 第 4 章 , 我 们 
将 使 用 上 下 文 无 关 文 法 来 描述 程序 设计 语言 的 语法 结构 ,并 讨论 为 某 些 类 型 的 语法 自动 构造 高 
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效 语法 分 析 器 的 算法 。 在 第 2 章 和 第 5 章 , 我 们 将 看 到 , 语法 制导 的 定义 将 有 助 于 描述 对 程序 设 
计 语 言 结 构 的 翻译 。 
1.2.3 ix 

语义 分 析 器 (semantic analyzer) 使 用 语法 树 和 符号 表 中 的 信息 来 检查 源 程序 是 否 和 语言 定义 
的 语义 一 致 。 它 同时 也 收集 类 型 信息 , 并 把 这 些 信 息 存 放 在 语法 树 或 符号 表 中 , 以 便 在 随后 的 中 
间 代 码 生成 过 程 中 使 用 。 

语义 分 析 的 一 个 重要 部 分 是 类 型 检查 (type checking) 。 编 译 器 检查 每 个 运算 符 是 否 具 有 匹配 
的 运算 分 量 。 比 如 , 很 多 程序 设计 语言 的 定义 中 要 求 一 个 数组 的 下 标 必须 是 整数 。 如 果 用 一 个 
浮 点 数 作为 数组 下 标 ， 编 译 器 就 必须 报告 错误 。 

程序 设计 语言 可 能 允许 某 些 类 型 转换 ， 这 被 称 为 自动 类 型 转换 (coercion) 。 比 如 ,一 个 二 元 
算术 运算 符 可 以 应 用 于 一 对 整数 或 者 一 对 浮 点 数 。 如 果 这 个 运算 符 应 用 于 一 个 浮 点 数 和 一 个 整 
数 , 那么 编译 器 可 以 把 该 整数 转换 (或 者 说 自动 类 型 转换 ) 成 为 一 个 浮 点 数 。 

图 1-7 中 显示 了 一 个 这 样 的 自动 类 型 转换 。 假设 position、initial 和 rate 已 被 声明 为 浮 
点 数 类 型 , 而 词素 60 本 身 形成 一 个 整数 。 图 1-7 中 的 语义 分 析 器 的 类 型 检查 程序 发 现 运算 符 * 被 用 
于 一 个 浮 点 数 rate 和 一 个 整数 60。 在 这 种 情况 下 , 这 个 整数 可 以 被 转换 成 为 一 个 浮 点 数 。 请 注 
意 , 在 图 1-7 F, 语义 分 析 器 输出 中 有 一 个 关于 运算 符 inttofloat 的 额外 结 点 。inttofloat 明确 地 把 它 
的 整数 参数 转换 为 一 个 浮 点 数 。 类 型 检查 和 语义 分 析 将 在 第 6 章 中 讨论 。 

1.2.4 中 间 代 码 生 成 

在 把 一 个 源 程序 翻译 成 目标 代码 的 过 程 中 , 一 个 编译 器 可 能 构造 出 一 个 或 多 个 中 间 表 示 。 
这 些 中 间 表 示 可 以 有 多 种 形式 。 语 法 树 是 一 种 中 间 表 示 形 式 , 它们 通常 在 语法 分 析 和 语义 分 析 
中 使 用 。 

在 源 程序 的 语法 分 析 和 语义 分 析 完 成 之 后 , 很 多 编译 器 生成 一 个 明确 的 低级 的 或 类 机 器 语 
言 的 中 间 表 示 。 我 们 可 以 把 这 个 表示 看 作 是 某 个 抽象 机 器 的 程序 。 该 中 间 表 示 应 该 具有 两 个 重 
要 的 性 质 : 它 应 该 易于 生成 , 且 能 够 被 轻松 地 翻译 为 目标 机 器 上 的 语言 。 

在 第 6 章 , 我 们 将 考虑 一 种 称 为 三 地 址 代码 (three-address code) 的 中 间 表 示 形 式 。 这 种 中 间 
表示 由 一 组 类 似 于 汇编 语言 的 指令 组 成 , 每 个 指令 具有 三 个 运算 分 量 。 每 个 运算 分 量 都 像 一 个 
寄存 器 。 图 1-7 中 的 中 间 代 码 生 成 器 的 输出 是 如 下 的 三 地 址 代码 序列 : 

tl = inttofloat (60) 
t2 = id3 * t1 


t3 = id2 + t2 (1:3) 
idi = t3 


关于 三 地 址 指令 ， 有 几 点 是 值得 专门 指出 的 。 首 先 , 每 个 三 地 址 赋值 指令 的 右 部 最 多 只 有 一 
个 运算 符 。 因 此 这 些 指令 确定 了 运算 完成 的 顺序 。 在 源 程序 1.1 中 , 乘法 应 该 在 加 法 之 前 完成 。 
第 二 , 编译 带 应 该 生成 一 个 临时 名 字 以 存放 一 个 三 地 址 指令 计算 得 到 的 值 。 第 三 ,， 有 些 三 地 址 指 
令 的 运算 分 量 的 少 于 三 个 (比如 上 面 的 序列 1. 3 中 的 第 一 个 和 最 后 一 个 指令 ) 。 

在 第 6 章 , 我 们 将 讨论 在 不 同 编译 器 中 用 到 的 主要 中 间 表 示 形 式 。 第 5 章 将 介绍 语法 制导 翻 
译 技术 。 这 些 技术 在 第 6 章 中 被 用 于 处 理 典 型 程序 设计 语言 构造 进行 类 型 检查 和 中 间 代 码 生 成 。 
这 些 程序 设计 语言 构造 包括 : 表达 式 、 控制 流 构 造 和 过 程 调 用 。 
1.25 代码 优化 

机 器 无 关 的 代码 优化 步 双 试图 改进 中 间 代 码 ， 以 便 生成 更 好 的 目标 代码 。“ 更 好 ”通常 意味 着 
更 快 , 但 是 也 可 能 会 有 其 他 目标 ,如 更 短 的 或 能 耗 更 低 的 目标 代码 。 比 如 , 一 个 简单 直接 的 算法 会 
生成 中 间 代码 (1. 3) 。 它 为 由 语义 分 析 器 得 到 的 树 形 中 间 表 示 中 的 每 个 运算 符 都 使 用 一 个 指令 。 
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使 用 一 个 简单 的 中 间 代 码 生成 算法 ,然后 再 进行 代码 优化 步 又 是 生成 优质 目标 代码 的 一 个 
合理 方法 。 优 化 器 可 以 得 出 结论 : 把 60 从 整数 转换 为 浮 点 数 的 运算 可 以 在 编译 时 刻 一 劳 永 逸 地 
完成 。 因 此 , 用 浮 点 数 60. 0 来 蔡 代 整 数 60 就 可 以 消除 相应 的 inttofloat 运算 而 且 , t3 仅 被 使 
用 一 次 , 用 来 把 它 的 值 传递 给 idl, Wike, 优化 器 可 以 把 序列 (1. 3) 转 换 为 更 短 的 指令 序列 


t1 = id3 * 60.0 
idi = id2 + t1 (EA 


不 同 的 编译 器 所 做 的 代码 优化 工作 量 相差 很 大 。 那 些 优化 工作 做 得 最 多 的 编译 器 ， 即 所 谓 的 
“优化 编译 器 ”， 会 在 优化 阶段 花 相当 多 的 时 间 。 有 些 简单 的 优化 方法 可 以 极 大 地 提高 目标 程序 的 运 
行 效率 而 不 会 过 多 降低 编译 的 速度 。 从 第 8 章 开始 , 将 详细 讨论 机 器 无 关 和 机 器 相关 的 优化 。 

1. 2.6 代码 生成 

代码 生成 器 以 源 程序 的 中 间 表 示 形 式 作为 输入 , 并 把 它 映 射 到 目标 语言 。 如 果 目 标语 言 是 
机 器 代码 , 那么 就 必须 为 程序 使 用 的 每 个 变量 选择 寄存 器 或 内 存 位 置 。 然 后 , 中间 指 令 被 翻译 成 
为 能 够 完成 相同 任务 的 机 器 指令 序列 。 代 码 生 成 的 一 个 至 关 重要 的 方面 是 合理 分 配 寄存 器 以 存 
放 变 量 的 值 。 

比如 , 使 用 寄存 器 R1 和 了 2 ，(1.4) 中 的 中 间 代 码 可 以 被 翻译 成 为 如 下 的 机 器 代码 : 

eF n vi #60.0 
LDF Ri, id2 (1.5) 


ADDF R1; Ri, R2 
SIF idi, Ri 


每 个 指令 的 第 一 个 运算 分 量 指定 了 一 个 目标 地 址 。 各 个 指令 中 的 告诉 我 们 它 处 理 的 是 浮 
点 数 。 代 码 (1.5) 把 地 址 id3 中 的 内 容 加 载 到 寄存 器 R2 中 , 然后 将 其 与 浮 点 常数 60. 0 TAFE. FF 
Hay = 60. 0 应 该 作为 一 个 立即 数 处 理 。 第 三 个 指令 把 ia2 移动 到 寄存 器 R1 中 , 而 第 四 个 指 
仿 把 前 面 计算 得 到 并 存放 在 R2 中 的 值 加 到 R1 上 。 最 后 , 在 寄存 器 R1 中 的 值 被 存放 到 idl 的 地 
址 中 去 。 这 样 , 这 些 代码 正确 地 实现 了 赋值 语句 (1.1)。 第 8 章 将 讨论 代码 生成 。 

下 面 对 代 码 生成 的 讨论 忽略 了 对 源 程序 中 的 标识 符 进行 存储 分 配 的 重要 问题 。 我 们 将 在 第 7 
章 中 看 到 ,运行 时 刻 的 存储 组 织 方法 依赖 于 被 编译 的 语言 。 编 译 器 在 中 间 代码 生成 或 代码 生成 
阶段 做 出 有 关 存 储 分 配 的 决定 。 

1.2.7 符号 表 管 理 

编译 器 的 重要 功能 之 一 是 记录 源 程序 中 使 用 的 变量 的 名 字 , 并 收集 和 每 个 名 字 的 各 种 属性 
有 关 的 信息 。 这 些 属 性 可 以 提供 一 个 名 字 的 存储 分 配 、 它 的 类 型 、 作 用 域 ( 即 在 程序 的 哪些 地 方 
可 以 使 用 这 个 名 字 的 值 ) 等 信息 。 对 于 过 程 名 字 , 这 些 信息 还 包括 : 它 的 参数 数量 和 类 型 、 每 个 
参数 的 传递 方法 (比如 传 值 或 传 引 用 ) 以 及 返回 类 型 。 

符号 表 数 据 结构 为 每 个 变量 名 字 创 建 了 一 个 记录 条 目 。 记录 的 字段 就 是 名 字 的 各 个 属性 。 
这 个 数据 结构 应 该 允许 编译 器 迅速 查找 到 每 个 名 字 的 记录 ,并 向 记录 中 快速 存放 和 获取 记录 中 
的 数据 。 符 号 表 在 第 2 章 中 讨论 。 ii 
1.2.8 将 多 个 步骤 组 合成 趟 

前 面 关 于 步骤 的 讨论 讲 的 是 二 个 编译 器 的 逻辑 组 织 方式 。 在 二 个 特定 的 实现 中 ,多 个 步 又 
的 活动 可 以 被 组 合成 一 趟 (pass) 。 每 趟 读 入 一 个 输入 文件 并 产生 二 个 输出 文件 。 比 如 , 前端 步骤 
中 的 词法 分 析 、 语法 分 析 、 语义 分 析 , 以 及 中 间 代 码 生 成 可 以 被 组 合 在 一 起 成 为 一 趟 。 代 码 优化 
可 以 作为 一 个 可 选 的 趟 。 然 后 可 以 有 一 个 为 特定 目标 机 生成 代码 的 后 端 趟 。 

有 些 编译 器 集合 是 围绕 一 组 精心 设计 的 中 间 表 示 形 式 而 创建 的 , 这 些 中 间 表 示 形 式 使 得 我 
们 可 以 把 特定 语言 的 前 端 和 特定 目标 机 的 后 端 相 结 合 。 使 用 这 些 集合 ; 我 们 可 以 把 不 同 的 前 端 


5l 论 7 





和 某 个 目标 机 的 后 端 结合 起 来 ， 为 不 同 的 源 语言 建立 该 目标 机 上 的 编译 器 。 类 似 地 , 我 们 可 以 把 
一 个 前 端 和 不 同 的 目标 机 后 端 结合 ,建立 针对 不 同 目标 机 的 编译 器 。 
1.2.9 ”编译 器 构造 工具 

和 任 柯 款 件 开发 者 一 释 ， 写 编译 器 的 人 可 以 充分 利用 现代 的 软件 开发 环境 。 这 些 环境 中 包 
含 了 诸如 语言 编辑 器 、 调 试 器 、 版 本 管理 、 程 序 描述 器 、 测 试管 理 等 工具 。 除 了 这 些 通用 的 软件 
开发 工具 ”大 们 还 创建 了 一 些 更 加 专业 的 工具 来 实现 编译 器 的 不 同 阶段 。 

这 些 工具 使 用 专用 的 语言 来 描述 和 实现 特定 的 组 件 , 其 中 的 很 多 工具 使 用 了 相当 复杂 的 算 
法 三 其 中 最 成 功 的 工具 都 能 够 隐藏 生成 算法 的 细节 ， 并且 它 们 生成 的 组 件 易于 和 编译 器 的 其 他 
部 分 相 集 成 一些 常 用 的 编译 器 构造 工具 包括 : 

1) 语法 分 析 器 的 生成 器 : 可 以 根据 一 个 程序 设计 语言 的 语法 描述 自动 生成 语法 分 析 器 。 

2) 扫 猫 加 的 生成 回 ; 可 以 根据 一 个 语言 的 语法 单元 的 正则 表达 式 描 述 生成 词法 分 析 器 。 

3) 语法 制导 的 翻译 引擎 : 可 以 生成 一 组 用 于 遍历 分 析 树 并 生成 中 间 代 码 的 例 程 。 

4) 代码 生成 器 的 生成 器 : 依据 二 组 关于 如 何 把 中 间 语 言 的 每 个 运算 翻译 成 为 目标 机 上 的 机 
器 语言 的 规则 , 生成 一 个 代码 生成 器 。 

5) 数据 流 分 析 引 党: 可 以 帮助 收集 数据 流 信息 ， 即 程序 中 的 值 如 何 从 程序 的 一 个 部 分 传递 
到 另 一 部 分 。 数 据 流 分 析 是 代码 优化 的 一 个 重要 部 分 。 

6) 编译 器 构造 工具 集 : 提供 了 可 用 于 构造 编译 器 的 不 同 阶 段 的 例 程 的 完整 集合 。 

在 本 书 中 , 我 们 将 讨论 多 个 这 类 工具 的 例子 。 


1.3) 程序 设计 语言 的 发 展 历程 


第 二 台电 子 计 算 机 出 现在 20 世纪 40 年 代 。 它 使 用 由 0、1 序列 组 成 的 机 器 语言 编程 ,这 个 
序列 明确 地 告诉 计算 机 以 什么 样 的 顺序 执行 哪些 运算 。 运 算 本 身 也 是 很 低层 的 : 把 数据 从 一 个 
位 置 移动 到 另 一 个 位 置 , 把 两 个 寄存 器 中 的 值 相 加 ， 比 较 两 个 值 , 等 等 。 不 用 说 , 这 种 编程 速度 
MAAR, 而 且 容 易 出 错 。 写 出 的 程序 也 是 难以 理解 和 修改 的 。 

1.3.1 走向 高 级 程序 设计 语言 

走向 更 加 人 类 友好 的 程序 设计 语言 的 第 一 步 是 20 世纪 50 年 代 早期 人 们 对 助 记 汇编 语言 的 
开发 。 一 开始 , 一 个 汇编 语言 中 的 指令 仅仅 是 机 器 指令 的 助 记 表 示 。 后 来 ; 宏 指令 被 加 入 到 汇编 
语言 中 。 这 样 , 程序 员 就 可 以 通过 宏 指令 为 频繁 使 用 的 机 器 指令 序列 定义 带 有 参数 的 缩写 。 

走向 高 级 程序 设计 语言 的 重大 一 步 发 生 在 20 世纪 50 年 代 的 后 五 年 。 其 间 , 用 于 科学 计算 的 
Fortran 语言 , 用 于 商业 数据 处 理 的 Cobol 语言 和 用 于 符号 计算 的 Lisp 语言 被 开发 出 来 。 在 这 些 语 
言 的 基本 原理 是 设计 高 层次 表示 方法 , 使 得 程序 员 可 以 更 加 容易 地 写 出 数值 计算 商业 应 用 和 符 
号 处 理 程序 。 这 些 语言 取得 了 很 大 的 成 功 , 至 今 仍然 有 人 使 用 它们 。 

在 接 下 来 的 几 十 年 里 , 很 多 带 有 新 特性 的 程序 设计 语言 被 陆续 开发 出 来 。 它 们 使 得 编程 更 
加 容易 、 自 然 ;功能 也 更 强大 。 我 们 将 在 本 章 的 后 面部 分 讨论 很 多 现代 程序 设计 语言 所 共有 的 一 
些 关 键 特征 。 

当前 有 几 千 种 程序 设计 语言 。 可 以 通过 不 同 的 方式 对 这 些 语 言 进行 分 类 。 方 式 之 一 是 通过 
语言 的 代 来 分 类 。 第 一 代 语 言 是 机 器 语言 ， 第 三 代 语 言 是 汇编 语言 ,) 而 第 三 代 语 言 是 Fortran、 
Cobol, Lisp, C, C ++ 、C# 及 Java 这 样 的 高 级 程序 设计 语言 。 第 四 代 语言 是 为 特定 应 用 设计 的 语 
言 ,比如 用 于 生成 报告 的 NOMAD, 用 于 数据 库 查 询 的 SQL 和 用 于 文本 排版 的 Postscript。 术 语 第 
五 代 语 言 指 的 是 基于 逻辑 和 约束 的 语言 ,比如 Prolog 和 OPS5。 
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另 二 种 语言 分 类 方式 把 程序 中 指明 如 何 完成 一 个 计算 任务 的 语言 的 称 为 强制 式 (imperative ) 语 
言 , 而 把 程序 中 指明 要 进行 哪些 计算 的 语言 称 为 声明 式 ( declarative) 语言。 诸如 C, C++. CHA Java 
等 语言 都 是 强制 式 语言 。 所 有 强制 式 语言 中 都 有 用 于 表示 程序 状态 和 语句 的 表示 方法 ,这些 语句 可 
以 改变 程序 状态 。 像 ML、Haskell 这 样 的 函数 式 语言 和 Prolog 这 样 的 约束 逻辑 语言 通常 被 认为 是 声 
明 式 语言 。 

RIE + 诺 伊 曼 语 言 (von Neumann language) 是 指 以 汉 - 诺 伊 曼 计 算 机 体系 结构 为 计算 模型 
的 程序 设计 语言 。 今 天 的 很 多 语言 ( 比如 Fortran 和 C) AES > 诺 伊 曼 语 言 。 

面向 对 象 语言 (object-oriented language) 指 的 是 支持 面向 对 象 编程 的 语言 ， 面向 对 象 编程 是 指 
用 一 组 相互 作用 的 对 象 组 成 程序 的 编程 风格 。Simula 67 和 Smalltalk 是 早期 的 主流 面向 对 象 语言 。 
C++, C#, Java 和 Ruby 是 现在 常用 的 面向 对 象 语言 。 

脚本 语言 (scripting language) 是 具有 高 层次 运算 符 的 解释 型 语言 , 它 通常 被 用 于 把 多 个 计算 过 

程 “ 粘 合 ” 在 一 起 。 这 些 计算 过 程 被 称 为 脚本 。Awk、 JavaScript, Perl, PHP, Python, Ruby 和 Tcl 是 常 
见 的 脚本 语言 。 使 用 脚本 语言 编写 的 程序 通常 要 比 用 其 他 语言 (比如 C) 写 的 等 价 的 程序 短 很 多 。 
1.3.2 ”对 编译 器 的 影响 

因为 程序 设计 语言 的 设计 和 编译 器 是 紧密 相关 的 , 程序 设计 语言 的 发 展 向 编译 器 的 设计 者 
提出 了 新 的 要 求 。 他 们 必须 设计 相应 的 算法 和 表示 方式 来 翻译 和 支持 新 的 语言 特征 。 从 20 世纪 
40 年 代 以 来 , 计算 机 体系 结构 也 有 了 很 大 的 发 展 。 编 译 器 的 设计 者 不 仅 需要 跟踪 新 的 语言 特征 ， 
还 需要 设计 出 新 的 翻译 算法 , 以 便 尽 可 能 地 利用 新 硬件 的 能 力 。 

通过 降低 用 高 级 语言 程序 的 执行 开销 , 编译 器 还 可 以 推动 这 些 高 级 语言 的 使 用 。 要 使 得 高 性 能 计 
算 机 体系 结构 能 够 高 效 运行 用 户 应 用 , 编译 器 也 是 至 关 重 要 的 。 实 际 上 ， 计算 机 系统 的 性 能 是 非常 依 
赖 于 编译 技术 的 , 以 至 于 在 构建 一 个 计算 机 之 前 , 编译 器 会 被 用 作 评 价 一 个 体系 结构 概念 的 工具 。 

编写 编译 器 是 很 有 挑战 性 的 。 编 译 器 本 身 就 是 一 个 大 程序 。 而 且 , 很 多 现代 语言 处 理 系统 在 同 
一 个 框架 内 处 理 多 种 源 语言 和 目标 机 。 也 就 是 说 , 这 些 系统 可 以 被 当做 一 组 编译 器 来 使 用 , 可 能 包 
含 几 百 万 行 代码 。 因 此 , 好 的 软件 工程 技术 对 于 创建 和 发 展现 代 的 语言 处 理 器 是 非常 重要 的 。 

编译 器 必须 能 够 正确 翻译 用 源 语 言 书写 的 所 有 程序 。 这 样 的 程序 的 集合 通常 是 无 穷 的 。 为 
一 个 源 程序 生成 最 佳 目标 代码 的 问题 一 般 来 说 是 不 可 判定 的 。 因 此 ,编译 器 的 设计 者 必须 作出 
折衷 处 理 ,， 确定 解决 哪些 问题 , 使 用 哪些 启发 式 信息 , 以便 解 决 高 效 代码 生成 的 问题 。 

我 们 将 在 1.4 节 看 到 , 有 关 编 译 器 的 研究 也 是 有 关 如 何 使 用 理论 来 解决 实践 问题 的 研究 。 

本 书 的 目的 是 教授 编译 器 设计 中 使 用 的 根本 思想 和 方法 论 。 本 书 并 不 想 让 读者 学 习 建立 一 
个 最 新 的 语言 处 理 系 统 时 可 能 用 到 的 所 有 算法 和 技术 。 但 是 , 本 书 的 读者 将 获得 必要 的 基础 知 
识 和 理解 ,学 会 建立 一 个 相对 简单 的 编译 器 。 
1.3.3 1.3 节 的 练习 

练习 1. 3.1: 指出 下 面 的 术语 : 

1) 强制 式 的 2) 声明 式 的 3) 汉 … 庄 伊 曼 式 的 4) 面向 对 象 的 


5) 函数 式 的 6) 第 三 代 7) 第 四 代 8) 脚本 语言 
可 以 被 用 于 描述 下 面 的 哪些 语言 : 

1) C 2) C++ 3) Cobol 4) Fortran 5) Java 
6) Lisp 7) ML 8) Perl 9) Python 10) VB 


1.4 构建 一 个 编译 器 的 相关 科学 
编译 器 的 设计 中 有 很 多 通过 数学 方法 抽象 出 问题 本 质 从 而 解决 现实 世界 中 复杂 问题 的 完美 
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例子 。 这 些 例 子 可 以 被 用 来 说 明 如 何 使 用 抽象 方法 来 解决 问题 : 接受 一 个 问题 , 写 出 抓 住 了 问题 
的 关键 特性 的 数学 抽象 表示 , 并 用 数学 技术 来 解决 它 。 问 题 的 表达 必须 根植 于 对 计算 机 程序 特 
性 的 深入 理解 , 而 解决 方法 必须 使 用 经 验 来 验证 和 精 化 。 

编译 器 必须 接受 所 有 遵循 语言 规范 的 源 程序 。 源 程序 的 集合 是 无 穷 的 , 而 程序 可 能 大 到 包 
含 几 百 万 行 代码 。 在 翻译 一 个 源 程序 的 过 程 中 ,编译 器 所 做 的 任何 翻译 工作 都 不 能 改变 被 编译 
源 程序 的 含义 。 因 此 ,编译 器 设计 者 的 工作 不 仅 会 影响 到 他 们 创建 的 编译 器 ,还 会 影响 到 他 们 所 
创建 的 编译 器 所 编译 的 全 部 程序 。 这 种 杠杆 作用 使 得 编译 器 设计 的 回报 丰厚 , 但 也 使 得 编译 器 
的 开发 工作 具有 挑战 性 。 

1.4.1 编译 器 设计 和 实现 中 的 建 模 

对 编译 器 的 研究 主要 是 有 关 如 何 设计 正确 的 数学 模型 和 选择 正确 算法 的 研究 。 设 计 和 选择 
时 , 还 需要 考虑 到 对 通用 性 及 功能 的 要 求 与 简单 性 及 有 效 性 之 间 的 平衡 。 

最 基本 的 数学 模型 是 我 们 将 在 第 3 章 介 绍 的 有 穷 状态 自动 机 和 正则 表达 式 。 这 些 模 型 可 以 
用 于 描述 程序 的 词法 单位 (关键 字 、 标 识 符 等 ) 以 及 描述 被 编译 器 用 来 识别 这 些 单 位 的 算法 。 最 
基本 的 模型 中 还 包括 上 下 文 无 关 文法 ， 它 用 于 描述 程序 设计 语言 的 语法 结构 ;比如 内 套 的 括号 和 
控制 结构 。 我 们 将 在 第 4 章 研究 文法 。 类 似 地 , 树 形 结构 是 表示 程序 结构 以 及 程序 到 目标 代码 的 
翻译 方法 的 重要 模型 。 我 们 将 在 第 5 章 介绍 这 一 概念 。 

1.4.2 代码 优化 的 科学 

在 编译 器 设计 中 , 术语 “优化 ”是 指 编译 器 为 了 生成 比 浅显 直观 的 代码 更 加 高 效 的 代码 而 做 
的 工作 。“ 优 化 "这 个 词 并 不 恰当 , 因为 没有 办 法 保证 一 个 编译 器 生成 的 代码 比 完成 相同 任务 的 
任何 其 他 代码 更 快 , 或 至 少 一 样 快 。 

现在 ,编译 器 所 作 的 代码 优化 变 得 更 加 重要 ,而 且 更 加 复杂 。 之 所 以 变 得 更 加 复杂 , 是 因为 
处 理 器 体系 结构 变 得 更 加 复杂 , 也 有 了 更 多 改进 代码 执行 方式 的 机 会 。 之 所 以 变 得 更 加 重要 , 是 
因为 巨型 并 发 计算 机 要 求实 质 性 的 优化 , 否则 它们 的 性 能 将 会 旦 数量 级 地 下 降 。 随 着 多 核 计算 
机 (这 些 计算 机 上 的 芯片 拥有 多 个 处 理 器 ) 日 益 流行 , 所 有 的 编译 器 都 将 面临 充分 利用 多 处 理 器 
计算 机 的 优势 的 问题 。 

即使 有 可 能 通过 随意 的 方法 来 建造 一 个 健壮 的 编译 器 , 实现 起 来 也 是 非常 困难 的 。 因 此 , 人们 
已 经 围绕 代码 优化 建立 了 一 套 广泛 且 有 用 的 理论 。 应 用 严格 的 数学 基础 , 使 得 我 们 可 以 证 明 一 个 优 
化 是 正确 的 , 并 且 它 对 所 有 可 能 的 输入 都 产生 预期 的 效果 。 从 第 9 章 开始 , 我 们 将 会 看 到 , 如果 想 
使 得 编译 器 产生 经 过 良好 优化 的 代码 , 图、 和 矩阵 和 线性 规划 之 类 的 模型 是 必 不 可 少 的 ， 

从 男 一 方面 来 说 , 只 有 理论 是 不 够 的 。 很 多 现实 世界 中 的 问题 都 没有 完美 的 答案 。 实 际 上 ， 
我 们 在 编译 器 优化 中 提出 的 很 多 问题 都 是 不 可 判定 的 。 在 编译 器 设计 中 ， 最 重要 的 技能 之 一 是 
明确 描述 出 真正 要 解决 的 问题 的 能 力 。 我 们 在 一 开始 需要 对 程序 的 行为 有 充分 的 了 解 ， 并 且 需 
要 通过 充分 的 试验 和 评价 来 验证 我 们 的 直觉 。 

编译 器 优化 必须 满足 下 面 的 设计 目标 : 

。 优化 必须 是 正确 的 , 也 就 是 说 , 不 能 改变 被 编译 程序 的 含义 。 

© 优化 必须 能 够 改善 很 多 程序 的 性 能 。 

o 优化 所 需 的 时 间 必 须 保持 在 合理 的 范围 内 。 

e 所 需要 的 工程 方面 的 工作 必须 是 可 管理 的 。 

对 正确 性 的 强调 是 无 论 如 何不 会 过 分 的 。 不管 设计 得 到 的 编译 器 能 够 生成 运行 速度 多 么 快 的 代 

码 , 只 要 生成 的 代码 不 正确 , 这 个 设计 就 是 毫 无 意义 的 。 正 确 设计 优化 编译 器 是 如 此 困难 , 我 们 敢 说 没 
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有 一 个 优化 编译 器 是 完全 无 错 的 ! 因此 ， 设计 一 个 编译 器 时 最 重要 的 目标 是 使 它 正确 。 

第 二 个 目标 是 编译 器 应 该 有 效 提高 很 多 输入 程序 的 性 能 。 性 能 通常 意味 着 程序 执行 的 速度 。 
我 们 也 希望 能 够 尽 可 能 降低 生成 代码 的 大 小 ， 在 向 人 入 式 系统 中 更 是 如 此 。 而 对 于 移动 设备 的 情 
况 , 尽量 降低 代码 的 能 耗 也 是 我 们 期 待 的 。 在 通常 情况 下 ， 提高 执行 效率 的 优化 也 能 够 节约 能 
耗 。 除 了 性 能 ,错误 报告 和 调试 等 的 可 用 性 方面 也 是 很 重要 的 。 

第 三 , 我 们 需要 使 编译 时 间 保 持 在 较 短 的 范围 内 ， 以 支持 快速 的 开发 和 调试 周期 ? 当 机 器 变 
得 越 来 越 快 , 这 个 要 求 会 越 来 越 容易 达到 。 开 始 时 ， 一 个 程序 经 常 在 没有 进行 优化 的 情况 下 开发 
和 调试 。 这 么 做 不 仅 可 以 降低 编译 时 间 ， 更 重要 的 是 未 经 优化 的 程序 比较 容易 调试 。 这 是 因为 
编译 器 引入 的 优化 经 常 使 得 源 代码 和 目标 代码 之 间 的 关系 变 得 模糊 。 在 编译 器 中 开启 优化 有 时 
会 暴露 出 源 程序 中 的 新 闻 题 , 因此 需要 对 经 过 优化 的 代码 再 次 进行 测试 。 因为 可 能 需要 额外 的 
测试 工作 , 有 时 会 阻止 人 们 在 应 用 中 使 用 优化 技术 当 应 用 的 性 能 不 很 重要 的 时 候 更 是 如 此 。 

最 后 ,编译 器 是 一 个 复杂 的 系统 ， 我 们 必须 使 系统 保持 简单 以 保证 编译 器 的 设计 和 维护 费用 
是 可 管理 的 。 我 们 可 以 实现 的 优化 技术 有 无 穷 多 种 ， 而 创建 一 个 正确 有 效 的 优化 过 程 需要 相当 
大 的 工作 量 。 我 们 必须 划分 不 同 优化 技术 的 优先 级 别 ， 只 实现 那些 可 以 对 实践 中 遇 到 的 源 程序 
带 来 最 大 好 处 的 技术 。 

因此 , 我 们 在 研究 编译 器 时 不 仅 要 学 习 如 何 构 造 一 个 编译 器， 还 要 学 习 解决 复杂 和 开放 性 问 
题 的 一 般 方法 学 。 在 编译 器 开发 中 用 到 的 方法 涉及 理论 和 实验 。 在 开始 的 时 候 ， 我 们 通常 根据 
直觉 确定 有 哪些 重要 的 问题 并 把 它们 明确 描述 出 来 。 


1.5 编译 技术 的 应 用 


编译 器 设计 并 不 只 是 关于 编译 器 的 。 很 多 人 用 到 了 在 学 校 里 研究 编译 器 时 学 到 的 技术 , 但 
是 严格 地 说 , 它们 从 没有 为 一 个 主流 的 程序 设计 语言 编写 过 一 个 编译 器 (甚至 其 中 的 一 部 分 )。 
编译 器 技术 还 有 其 他 重要 用 途 。 另 外 ,编译 器 设计 影响 了 计算 机 科学 中 的 其 他 领域 。 在 本 节 , 我 
们 将 回顾 和 编译 技术 有 关 的 最 重要 的 互动 和 应 用 。 
1.5.1 ”高 级 程序 设计 语言 的 实现 

_ 个 高 级 程序 设计 语言 定义 了 一个 编程 抽象 : 程序 员 使 用 这 个 语言 表达 算法 , 而 编译 器 必须 
把 这 个 程序 翻译 成 目标 语言 。 总 的 来 说 ,用 高 级 程序 设计 语言 编程 比较 容易 , 但 是 比较 低 效 , 也 
就 是 说 ,目标 程序 运行 较 慢 。 使 用 低级 程序 设计 语言 的 程序 员 能 够 更 多 地 控制 一 个 计算 过 程 , 因 
此 从 原则 上 讲 , 可 以 产生 更 加 高 效 的 代码 。 遗 憾 的 是 ， 低 级 程序 比较 难 编写 ， 而 且 更 精 糕 的 是 可 
移植 性 较 差 , 更 容易 出 错 , 而 且 更 加 难以 维护 。 优 化 编译 器 包括 了 提高 所 生成 代码 性 能 的 技术 ， 
因此 弥补 了 因 高 层次 抽象 而 引入 的 低 效率 。 
C 语言 中 的 关键 字 register 是 编译 器 技术 和 语言 发 展 互动 的 一 个 较 早 的 例子 。 当 C 语 
言 在 20 世纪 70 年 代 中 期 被 创立 时 ,人 们 认为 有 必要 让 程序 员 来 控制 哪个 程序 变量 应 该 存放 在 寄 
存 器 中 。 当 有 效 的 寄存 器 分 配 技术 出 现 后 , 这 个 控制 变 得 没有 必要 了 ; 大 多 数 现代 的 程序 不 再 使 
用 这 个 语言 特征 。 

实际 上 , 使 用 关键 字 register 的 程序 还 可 能 损失 效率 ; 因为 寄存 器 分 配 是 一 类 很 低层 次 的 问 
题 , 程序 员 常常 不 是 最 好 的 判断 这 类 问题 的 人 选 寄存 器 分 配 的 最 优选 择 很 大 程度 上 取决 于 一 
个 机 器 的 体系 结构 的 特点 。 把 低层 次 资源 管理 的 决策 ,比如 寄存 器 分 配 ， 写 死 在 程序 中 反而 有 可 
能 损害 性 能 。 当 运行 程序 的 计算 机 有 别 于 当初 所 设 定 的 目标 机 时 更 是 如 此 。 口 

对 于 程序 设计 语言 的 选择 的 变化 与 不 断 提高 抽象 层次 的 方向 是 一 致 的 。C 语言 是 在 20 世纪 
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80 年 代 主 流 的 系统 程序 设计 语言 ; 20 世纪 90 年 代 开 始 的 很 多 项 目 则 选择 C++ ; E 1995 年 推出 
的 Java 很 快 在 20 世纪 90 ,年代 后 期 流行 起 来 。 在 每 一 轮 中 引入 的 新 的 程序 设计 语言 特征 都 会 推 
动 对 于 编译 器 优化 的 新 研究 。 接 下 来 , 我 们 将 给 出 一 个 关于 主要 语言 特征 的 概览 , 这些 特征 曾经 
推动 了 编译 器 技术 的 重要 发 展 。 

在 实践 中 , 所 有 的 通用 程序 设计 语言 , 包括 C、Fortran 和 Cobol, 都 支持 用 户 定义 的 聚合 类 型 
(如 数组 和 结构 ) 和 高 级 控制 流 ( 比 如 循环 和 过 程 调用 )。 如 果 我 们 仅仅 把 每 个 高 级 结构 和 数据 存 
取 运 算 直 接 翻 译 成 为 机 器 代码 , 得 到 的 代码 将 会 非常 低 效 。 编 译 器 优化 的 一 个 组 成 部 分 称 为 数 
据 流 优化 , 它 可 以 对 程序 的 数据 流 进行 分 析 , 并 消除 这 些 构 造 之 间 的 完 余 。 它 们 很 有 效 , 生成 的 
代码 和 一 个 熟练 的 低级 语言 程序 员 所 写 的 代码 类 似 。 

面向 对 象 概 念 首先 于 1967 年 在 Simula 中 引入 ,并 被 集成 到 Smalltalk, C++ 、C# 和 Java 这 样 
的 语言 中 。 面 向 对 象 的 主要 思想 是 

1) 数据 抽象 

2) 特性 的 继承 

人 们 发 现 这 两 者 都 可 以 使 得 程序 更 加 模块 化 和 易于 维护 。 面 向 对 象 程序 和 用 很 多 其 他 语言 
写 的 程序 之 间 的 不 同 在 于 它们 由 多 得 多 的 (但 是 较 小 ) 过 程 (在 面向 对 象 术语 中 称 为 方法 ( method ) ) 
组 成 。 因 此 , 编译 器 优化 技术 必须 能 够 很 好 地 跨越 源 程序 中 的 过 程 边界 进行 优化 。 过 程 内 联 技 
术 ( 即 把 一 个 过 程 调用 替换 为 相应 过 程 体 ) 在 这 里 是 非常 有 用 的 。 大 们 还 开发 了 可 以 加 速 虚拟 方 
法 分 发 的 优化 技术 。 

Java 有 很 多 特征 可 以 使 编程 变 得 更 容易 ,其 中 的 很 多 特征 之 前 已 经 在 别 的 语言 中 引入 。Java 
语言 是 类 型 安全 的 ; 也 就 是 说 ,一 个 对 象 不 能 被 当 作 另 二 个 无 关 类 型 的 对 象 来 使 用 。 所 有 的 数组 
访问 运算 都 会 被 检查 以 保证 它们 在 数组 的 界限 之 内 。Java 没有 指针 , 也 不 允许 指针 运算 。 它 具有 
一 个 内 建 的 垃圾 收集 机 制 来 自动 释放 那些 不 再 使 用 的 变量 所 占用 的 内 存 。 虽 然 所 有 这 些 特 征 使 
得 编程 变 得 更 加 容易 , 但 它们 也 会 引起 运行 时 刻 的 开销 。 人 们 开发 了 相应 的 编译 优化 技术 来 降 
低 这 个 开销 。 比 如 , 消除 不 必要 的 下 标 范围 检查 , 以 及 把 那些 在 过 程 之 外 不 可 访问 的 对 象 分 配 在 
栈 里 而 不 是 堆 里 。 此 外 ， 人们 还 开发 了 高 效 的 算法 来 尽量 降低 垃圾 收集 的 开销 。 

除 此 之 外 ，Java 用 来 支持 可 移植 和 可 移动 的 代码 。 程 序 以 Java 字 节 码 的 方式 分 发 。 这些 字 
节 码 要 么 被 解释 执行 , 要 么 被 动态 地 ( 即 在 运行 时 刻 ) 编译 为 本 地 代码 。 动 态 编译 也 曾经 在 其 他 
土 下 文 环境 中 被 研究 过 。 在 那里 ,信息 在 运行 时 刻 被 动态 地 抽取 出 来 , 并 用 来 生成 更 加 优化 的 代 
码 。 在 动态 编译 中 , 尽 可 能 降低 编译 时 间 是 很 重要 的 , 因为 编译 时 间 也 是 运行 开销 的 一 部 分 。- 
个 常用 的 技术 是 只 编译 和 优化 那些 经 常 运行 的 程序 片断 。 

1.5.2 针对 计算 机 体系 结构 的 优化 

计算 机 体系 结构 的 快速 发 展 也 对 新 编译 器 技术 提出 了 越 来 越 多 的 需求 。 几 乎 所 有 的 高 性 能 
系统 都 利用 了 两 种 技术 : 并 行 (parallelism) 和 内 存 层 次 结构 (memory hierarchy) 。 并 行 可 以 出 现在 
多 个 层次 上 : 在 指令 层次 局 多 个 运算 可 以 被 同时 执行 ;| 在 处 理 器 层次 上 ， 同一 个 应 用 的 多 个 不 
同 线程 在 不 同 的 处 理 器 上 运行 ; 内 存 层次 结构 是 应 对 下 述 局 限 性 的 方法 : 我 们 可 以 制造 非常 快 
的 内 存 , 或 者 非常 大 的 内 存 , 但 是 无 法 制造 非常 大 又 非常 快 的 内 存 。 

并 行 性 

所 有 的 现代 微 处 理 器 都 采用 了 指令 级 并 行 性 。 但是, 这 种 并 行 性 可 以 对 程序 员 隐藏 起 来 。 
程序 员 写 程序 的 时 候 就 好 像 所 有 指令 都 是 顺序 执行 的 。 硬件 动态 地 检测 顺序 指令 流 之 间 的 依赖 
关系 , 并 且 在 可 能 的 时 候 并 行 地 发 出 指令 。 在 有 些 情况 下 ， 机 器 包含 一 个 硬件 调度 器 。 该 调度 器 
可 以 改变 指令 的 顺序 以 提高 程序 的 并 行 性 。 不 管 硬 件 是 否 对 指令 进行 重新 排序 , 编译 器 都 可 以 
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重新 安排 指令 ,以 使 得 指令 级 并 行 更 加 有 效 。 

指令 级 的 并 行 也 显 式 地 出 现在 指令 集中 。VLIW( Very Long Instruction Word, 非常 长 指令 字 ) 
机 器 拥有 可 并 行 执行 多 个 运算 的 指令 。Intel IA64 是 这 种 体系 结构 的 三 个 有 名 的 例子 :所 有 的 高 
性 能 通用 微 处 理 器 还 包含 了 可 以 同时 对 一 个 向 量 中 的 所 有 数据 进行 运算 的 指令 。 天 们 已 经 开发 
出 了 相应 的 编译 器 技术 ,从 顺序 程序 出 发 为 这 样 的 机 器 自动 生成 代码 。 

多 处 理 器 也 已 经 日 益 流行 , 即使 个 人 计算 机 也 拥有 多 个 处 理 器 。 程序 员 可 以 为 多 处 理 器 编 
写 多 线程 的 代码 , 也 可 以 通过 编译 器 从 传统 的 顺序 程序 自动 生成 并 行 代码 。 这 样 的 编译 器 对 程 
序 员 隐藏 了 一 些 细 节 , 包括 如 何在 程序 中 找到 并 行 性 , 如 何在 机 器 中 分 发 计算 任务 , 以 及 如 何 最 
小 化 处 理 器 之 间 的 同步 和 通信 。 很 多 科学 计算 和 工程 性 应 用 需要 进行 高 强度 的 计算 ;因此 可 以 
从 并 行 处 理 中 得 到 很 大 的 好 处 。 人 们 已 经 开发 了 并 行 技术 以 便 自动 地 把 顺序 的 科学 计算 程序 翻 
译 成 为 多 处 理 器 代码 。 

内 存 层 次 结构 

一 个 内 存 层次 结构 由 几 层 具有 不 同 速度 和 大 小 的 存储 器 组 成 。 离 处 理 器 最 近 的 层 速 度 最 快 
但 是 容量 最 小 。 如 果 一 个 程序 的 大 部 分 内 存 访问 都 能 够 由 层次 结构 中 最 快 的 层 满足 ,那么 程序 
的 平均 内 存 访 问 时 间 就 会 降低 。 并 行 性 和 内 存 层 次 结构 的 存在 都 会 提高 一 个 机 器 的 潜在 性 能 。 
但 是 , 它们 必须 被 编译 器 有 效 利用 才能 够 真正 为 一 个 应 用 提供 高 性 能 计算 。 

内 存 层 次 结构 可 以 在 所 有 的 机 器 中 找到 。 一 个 处 理 器 通常 有 少量 的 几 百 个 字 节 的 寄存 器 ， 
几 层 包含 了 几 K 到 几 兆 字 节 的 高 速 缓存 , 包含 了 几 兆 到 几 G 字 节 的 物理 寄存 器 , 最 后 还 包括 多 
个 几 G 字 节 的 外 部 存储 器 。 相 应 地 , 层次 结构 中 相 邻 层次 间 的 存 取 速度 会 有 两 到 三 个 数量 级 上 
的 差异 。 系 统 性 能 经 常 受到 内 存 子 系统 的 性 能 (而 不 是 处 理 器 的 性 能 ) 的 限制 。 虽 然 一 般 来 说 纺 
译 器 注重 优化 处 理 器 的 执行 , 现在 人 们 更 多 地 强调 如 何 使 得 内 存 层次 结构 更 加 高 效 。 

高 效 使 用 寄存 器 可 能 是 优化 一 个 程序 时 要 处 理 的 最 重要 的 问题 。 和 寄存 器 必须 由 软件 明确 
管理 不 同 , 高 速 缓存 和 物理 内 存 是 对 指令 集合 隐藏 的 , 并 由 硬件 管理 。 人 们 发 现 , 由 硬件 实现 的 
高 速 缓存 管 理 策略 有 时 并 不 高 效 。 当 处 理 具有 大 型 数据 结构 (通常 是 数组 ) 的 科学 计算 代码 时 更 
是 如 此 。 我 们 可 以 改变 数据 的 布局 或 数据 访问 代码 的 顺序 来 提高 内 存 层次 结构 的 效率 。 我 们 也 
可 以 通过 改变 代码 的 布局 来 提高 指令 高 速 缓存 的 效率 。 

1.5.3 新 计算 机 体系 结构 的 设计 

在 计算 机 体系 结构 设计 的 早期 , 编译 器 是 在 机 器 建造 好 之 后 再 开发 的 。 现 在 , 这 种 情况 已 经 
有 所 改变 。 因 为 使 用 高 级 程序 设计 语言 是 一 种 规范 ， 决定 一 个 计算 机 系统 性 能 的 不 是 它 的 原始 
速度 , 还 包括 编译 器 能 够 以 何 种 程度 利用 其 特征 。 因 此 ， 在 现代 计算 机 体系 结构 的 开发 中 , 编译 
带 在 处 理 嚣 设计 阶段 就 进行 开发 , 然后 编译 得 到 代码 并 运行 于 模拟 器 上。 这 些 代码 被 用 来 评价 
提议 的 体系 结构 特征 。 

RISC 

有 关 编 译 器 如 何 影响 计算 机 体系 结构 设计 的 最 有 名 的 例子 之 一 是 RISC ( Reduced Instruction- 
Set Computer, 精简 指令 集 计 算 机 ) 的 发 明 。 在 发 明 RISC 之 前 ,趋势 是 开发 的 指令 集 越 来 越 复杂 ; 
以 使 得 汇编 编程 变 得 更 容易 。 这 些 体系 结构 称 为 CISC( Complex Instruction-Set Computer, 复杂 指 
令 集 计算 机 )。 比 如 ,CISC 指令 集 包 含 了 复杂 的 内 存 寻 址 模式 来 支持 对 数据 结构 的 访问 。 还 包含 
了 过 程 调 用 指令 来 保存 寄存 器 和 向 栈 中 传递 参数 。 1 

编译 器 优化 经 常 能 够 消除 复杂 指令 之 间 的 宛 余 ， 把 这 些 指令 削减 为 少量 较 简 单 的 运算 : 因 
此 ,人 们 期 望 设计 出 简单 指令 集 。 编 译 器 可 以 有 效 地 使 用 它们 ， 而 硬件 也 更 容易 进行 优化 。 

大 部 分 通用 处 理 器 体系 结构 ， 包括 PowerPC, SPARC, MIPS. Alpha 和 PA-RISC, 都 是 基于 
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RISC 概念 的 。 虽 然 x86 体系 结构 (最 流行 的 微 处 理 器 ) 具有 CISC 指令 集 , 但 在 这 个 处 理 器 本 身 的 
实现 中 使 用 了 很 多 为 RISC 机 器 发 展 得 到 的 思想 ; 不 仅 如 此 , 使 用 高 性 能 x86 机 器 的 最 有 效 的 方 
法 是 仅 使 用 它 的 简单 指令 。 

专用 体系 结构 

在 过 去 的 30 年 中 , 提出 了 很 多 的 体系 结构 概念 。 其 中 包括 : 数据 流 机 器 、 向量 机 、VLIW( 非 党 
长 指令 字 ) 机 器 、SIMD( 单 指令 ,多 数据 ) 处 理 器 阵列 、 心 动 阵列 (systolic array) 、 共 享 内 存 的 多 处 理 
器 、 分 布 式 内 存 的 多 处 理 器 。 每 种 体系 结构 概念 的 发 展 都 伴随 着 相应 编译 器 技术 的 研究 和 发 展 。 

这 些 思 想 中 的 一 部 分 已 经 应 用 到 嵌入 式 机 器 的 设计 中 。: 因 为 整个 系统 都 可 以 放 到 一 个 芯片 
里 面 , 所 以 处 理 器 不 再 是 预 包装 的 商品 。 人 们 可 以 针对 特定 应 用 进行 裁剪 以 获得 更 好 的 费 效 比 。 
由 于 规模 经 济 效用 ,通用 处 理 器 的 体系 结构 具有 趋同 性 。 而 专用 应 用 的 处 理 器 则 与 此 相反 , 体现 
出 了 计算 机 体系 结构 的 多 样 性 。 人 们 不 仅 需 要 编译 器 技术 来 为 这 些 体系 结构 编程 提供 支持 ， 也 
需要 用 它们 来 评价 拟 议 中 的 体系 结构 设计 。 

1.5.4 程序 翻译 

我 们 通常 把 编译 看 作 是 从 一 个 高 级 语言 到 机 器 语言 的 翻译 过 程 。 同样 的 技术 也 可 以 应 用 到 
不 同 种 类 的 语言 之 间 的 翻译 。 下 面 是 程序 翻译 技术 的 一 些 重要 应 用 。 

二 进 制 翻译 

编译 器 技术 可 以 用 于 把 一 个 机 器 的 二 进 制 代码 翻 译 成 另 一 个 机 器 的 二 进 制 代码 ， 使 得 可 以 
在 一 个 机 器 上 运行 原本 为 男 汪 个 指令 集 编译 的 程序 。 二 进 制 翻译 技术 已 经 被 不 同 的 计算 机 公司 
用 来 增加 它们 的 机 器 上 的 可 用 软件 。 特 别 地 ， 因 为 x86 在 个 人 计算 机 市 场 上 的 主导 地 位 ; 很 多 软 
件 都 是 以 x86 二 进 制 代码 的 形式 提供 的 。 人 们 开发 了 二 进 制 代码 翻译 器 ， 把 x86 代码 转换 成 
Alpha 和 Spare 的 代码 。Transmeta 公司 也 在 他 们 的 x86 指令 集 实现 中 使 用 了 二 进 制 转换 。 他 们 没 
有 直接 在 硬件 上 运行 复杂 的 x86 指令 集 , 他 们 的 Ttransmeta Crusoe 处 理 器 是 一 个 VLIW 处 理 器 ， 
它 依赖 于 二 进 制 翻 译 器 来 把 x86 代码 转换 成 为 本 地 的 VLIW 代码 。 

二 进 制 翻译 也 可 以 被 用 来 提供 向 后 兼容 性 。1994 4E, 24 Apple Macintosh 中 的 处 理 器 从 
Motorola MC68040 变 为 PowerPC 的 时 候 , 便 使 用 二 进 制 翻译 来 支持 PowerPC 处 理 器 运行 遗留 下 来 
的 MC68040 代码 。 

硬件 合成 

不 仅仅 大 部 分 软件 是 用 高 级 语言 描述 的 ， 连 大 部 分 硬件 设计 也 是 使 用 高 级 硬件 描述 语言 描 
述 的 , 这 些 语言 有 Verilog 和 VHDL ( Very high-speed integrated circuit Hardware Description Lan- 
guage, 甚 高 速 集成 电路 硬件 描述 语言 ) 。 硬件 设 计 通 常 是 在 寄存 器 传输 层 ( Register Transfer Level , 
RIE) 上 描述 的 。 在 这 个 层 中 , 变量 代表 寄存 器 ， 而 表达 式 代 表 组 合 逻 辑 。 硬 件 合 成 工具 把 RTL 
描述 自动 翻译 成 为 门 电路 , 而 门 电路 再 被 翻译 成 为 晶体 管 ， 最 后 生成 一 个 物理 布局 。 和 程序 设计 
语言 的 编译 器 不 同 , 这 些 工 具 经 常会 花费 几 个 小 时 来 优化 门 电路 。 还 存在 一 些 用 来 翻译 更 高 层 
次 (比如 行为 和 函数 层次 ) 的 设计 描述 的 技术 。 

数据 查询 解释 器 

除了 描述 软件 和 硬件 , 语言 在 很 多 应 用 中 都 是 有 用 的 。 比如 , 查询 语言 (特别 是 SQL 语言 
( Structured Query Language, 结构 化 查询 语言 ) 被 用 来 搜索 数据 库 。 数据 库 查 询 由 包含 了 关系 和 布 
尔 运 算 符 的 断言 组 成 。 它 们 可 以 被 解释 ， 也 可 以 编译 为 代码 ， 以 便 在 一 个 数据 库 中 搜索 满足 这 个 
断言 的 记录 。 

编译 然后 模拟 

模拟 是 在 很 多 科学 和 工程 领域 内 使 用 的 通用 技术 。 它 用 来 理解 一 个 现象 或 者 验证 一 个 设计 。 
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模拟 器 的 输入 通常 包括 设计 描述 和 某 次 特定 模拟 运行 的 具体 输入 参数 。 模 拟 可 能 会 非常 昂贵 。 
我 们 通常 需要 在 不 同 的 输入 集合 中 模拟 很 多 可 能 的 设计 选择 。 而 每 个 实验 可 能 需要 在 高 性 能 计 
算 机 上 花费 几 天 时 间 才 能 完成 。 另 一 个 方法 不 需要 写 一 个 模拟 器 来 解释 这 些 设计 。 它 对 设计 进 
行 编译 并 生成 能 够 在 机 器 上 直接 模拟 特定 设计 的 机 器 代码 。 后 者 的 运行 更 加 快 。 经 过 编译 的 模 
拟 运 行 可 以 比 基 于 解释 器 的 方法 快 几 个 数量 级 。 在 那些 可 以 模拟 用 Verilog 或 VHDL 描述 的 设计 
的 最 新 工具 中 ， 人 们 都 使 用 了 编译 后 模拟 的 技术 。 

1.5.5 软件 生产 率 工具 

程序 可 以 说 是 人 类 迄今 为 止 生产 出 的 最 复杂 的 工程 制品 , 它们 包含 了 很 多 很 多 的 细节 。 要 
使 得 程序 能 够 完全 正确 运行 ,每 个 细节 都 必须 是 正确 的 。 结 果 是 程序 中 的 错误 很 是 猩 儿 。 错 误 
可 以 使 一 个 系统 崩溃 , 产生 错误 的 输出 , 使 得 系统 容易 受到 安全 性 攻击 , 在 关键 系统 中 甚至 会 引 
起 灾难 性 的 运行 错误 。 测 试 是 对 系统 中 的 错误 进行 定位 的 主要 技术 。 

一 个 很 有 意思 且 很 有 前 景 的 辅助 性 方法 是 通过 数据 流 分 析 技 术 静 态 地 ( 即 在 程序 运行 之 前 ) 
定位 错误 。 数 据 流 分 析 可 以 在 所 有 可 能 的 执行 路 径 上 找到 错误 , 而 不 是 像 程序 测试 的 时 候 所 做 
的 那样 , 仅仅 是 在 那些 由 输入 数据 组 合 执行 的 路 径 上 找 错误 。 很 多 原本 为 编译 器 优化 所 开发 的 
数据 流 分 析 技 术 可 以 用 来 创建 相应 的 工具 , 帮助 程序 员 完成 他 们 的 软件 工程 任务 。 

找到 程序 的 所 有 错误 是 不 可 判定 问题 。 可 以 设计 一 个 数据 流 分 析 方法 来 找 出 所 有 可 能 带 有 
某 种 错误 的 语句 , 对 程序 员 发 出 警告 。 但 是 如 果 这 些 警 告 中 的 大 部 分 都 是 误 报 , 用 户 将 不 会 使 用 
这 个 工具 。 因 此 , 实用 的 错误 检测 器 经 常 既 不 是 健全 的 也 不 是 完全 的 。 也 就 是 说 , 它们 不 可 能 找 
出 程序 中 的 所 有 错误 , 也 不 能 保证 报告 的 所 有 错误 都 真正 是 错误 。 虽 然 如 此 ， 估 们 仍然 开发 了 很 
多 种 静态 分 析 工 具 , 这 些 工具 能 够 在 实际 程序 中 有 效 地 找到 错误 ,比如 释放 空 指针 或 已 释放 过 的 
指针 。 错 误 探 测 器 可 以 是 不 健全 的 。 这 个 事实 使 得 它们 和 编译 器 的 优化 有 着 显著 不 同 。 优 化 器 
必须 是 保守 的 , 在 任何 情况 下 都 不 能 改变 程序 的 语义 。 

在 本 节 中 , 我 们 将 提 到 使 用 程序 分 析 技 术 来 提高 软件 生产 效率 的 几 个 已 有 途径 。 这 些 分 析 
是 在 原本 为 编译 器 代码 优化 而 开发 的 技术 的 基础 上 建立 的 。 其 中 静态 探测 二 个 程序 是 否 具有 安 
全 漏洞 的 技术 是 极为 重要 的 。 

类 型 检查 

类 型 检查 是 一 种 有 效 的 , 且 被 充分 研究 的 技术 , CARPE PAR BES EAT DY 
用 来 检测 一 些 错误 ,比如 , 运算 被 作用 于 错误 类 型 的 对 象 上 , 或 者 传递 给 一 个 过 程 的 参数 和 该 过 程 
的 范 型 (signature) 不 匹配 。 通 过 分 析 程 序 中 的 数据 流 , 程序 分 析 还 可 以 做 出 比 检查 类 型 错误 更 多 的 
工作 。 比 如 , 一 个 指针 被 赋予 了 NULL 值 , 然后 又 立刻 被 释放 了 , 这 个 程序 显然 是 错误 的 。 

这 个 技术 也 可 以 用 来 捕捉 某 种 安全 漏洞 。 其 中 , 攻击 者 可 以 向 程序 提供 一 个 字符 串 或 者 其 
他 数据 , 而 这 些 数据 没有 被 程序 谨慎 使 用 。 一 个 用 户 提供 的 字符 串 可 以 被 加 上 一 个 “危险 "的 标 
号 。 如 果 没 有 检查 这 个 字符 串 是 否 满足 特定 的 格式 , 那么 它 仍 然 是 “危险 的。 如果 这 种 类 型 的 
字符 串 能 够 在 某 个 程序 点 上 影响 代码 的 控制 流 , 那么 就 存在 一 个 潜在 的 安全 漏洞 。 

边界 检查 

相对 于 较 高 级 的 程序 设计 语言 而 言 , 用 较 低级 语言 编程 更 加 容易 犯错 比如 ,很 多 系统 中 的 
安全 漏洞 都 是 因为 用 C 语言 编写 的 程序 中 的 缓冲 区 溢出 造成 的 。 因 为 CG 语言 没有 数组 边界 检查 
所 以 必须 由 用 户 来 保证 对 数组 的 访问 没有 超出 边界 。 因 为 不 能 检验 用 户 提供 的 数据 是 否 可 能 溢 
出 一 个 缓冲 区 , 程序 可 能 被 坎 骗 ,把 一 个 数据 存放 到 缓冲 区 之 外 。 攻 击 者 可 以 巧妙 处 理 这 些 数 
据 , 使 得 程序 做 出 错误 的 行为 , 从 而 危及 系统 的 安全 。 人 们 已 经 开发 了 一 些 技术 来 寻找 程序 中 的 
缓冲 区 溢出 , 但 收效 并 不 显著 。 
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如 果 程 序 是 用 一 种 包含 了 自动 区 间 检 查 的 安全 的 语言 编写 的 , 这 个 问题 就 不 会 发 生 。 用 来 
消除 程序 中 的 完 余 区 间 检 查 的 数据 流 分 析 技 术 也 可 以 用 来 定位 缓冲 区 溢出 错误 。 而 最 大 区 别 在 
T, 没 能 消除 某 个 区 间 检 查 仅 仅 会 导致 很 小 的 额外 运行 时 刻 开销 , 而 没有 指出 一 个 潜在 的 缓冲 区 
溢出 错误 却 可 能 危及 系统 的 安全 性 。 因 此 , 虽然 使 用 简单 的 技术 去 进行 区 间 检 查 优化 就 已 经 足 
ET, 但 在 错误 探测 工具 中 获得 高 质量 的 结果 则 需要 复杂 的 分 析 技 术 ， 比 如 在 过 程 之 间 跟 踪 指 针 
值 的 技术 。 

内 存 管理 工具 

垃圾 收集 机 制 是 在 效率 和 易 编 程 及 软件 可 靠 性 之 间 进 行 折 裹 处理 的 另 一 个 极 好 的 例子 。 自 
动 的 内 存 管理 消除 了 所 有 的 内 存 管 理 错 误 ( 比如 内 存 泄漏 )。 这 些 错误 是 C' 或 C ++ 程序 中 间 题 
的 主要 来 源 之 一 。 人 们 开发 了 很 多 工具 来 帮助 程序 员 寻 找 内 存 管理 错误 。 比 如 ,Purify 是 一 个 能 
药 动 态 地 搞 所 内 存 管理 错误 的 被 广泛 使 用 的 工具 。 还 有 一 些 能 够 帮助 六 态 识别 部 分 此 类 错误 的 
工具 也 已 经 被 开发 出 来 。 l 


1.6 程序 设计 语言 基础 


这 一 节 我 们 将 讨论 在 程序 设计 语言 的 研究 中 出 现 的 最 重要 的 术语 和 它们 的 区 别 & 我 们 的 目 
标 并 不 是 涵盖 所 有 的 概念 或 所 有 常见 的 程序 设计 语言 。 我 们 假设 读者 已 经 至 少 熟 悉 C、C ++、 
C# 或 Java 中 的 一 种 语言 , 并 且 也 可 能 已 经 遇 到 过 其 他 语言 。 

1.6.1 静态 和 动态 的 区 别 

在 为 一 个 语言 设计 一 个 编译 器 时 , 我 们 所 面 对 的 最 重要 的 问题 之 二 是 编译 器 能 够 对 二 个 程 
序 做 出 哪些 判定 。 如 果 一 个 语言 使 用 的 策略 支持 编译 器 静态 决定 某 个 问题 , 那么 我 们 说 这 不 语 
ee 一 个 静态 (static) 策 略 , 或 者 说 这 个 间 题 可 以 在 编译 时 刻 (compile time) 决 定 。 另 一 方面 ， 

ei ene ee se 或 者 被 认为 需 
ee 

我 们 需要 注意 的 另 一 个 问题 是 声明 的 作用 域 。x 的 一 个 声明 的 作用 域 (scope) 是 指 程 序 的 一 
个 区 域 , 在 其 中 对 的 使 用 都 指向 这 个 声明 。 如 果 仅 通过 阅读 程序 就 可 以 确定 一 个 声明 的 作用 
域 , 那么 这 个 语言 使 用 的 是 静态 作用 域 ( static scope), 或 者 说 词法 作用 域 (lexical scope)。 否 则 ， 
这 个 语言 使 用 的 是 动态 作用 域 (dynamic scope) 。 如 果 使 用 动态 作用 域 , 当 程序 运行 时 ， 同 二 个 对 
x 的 使 用 会 指向 x 的 几 个 声明 中 的 某 一 个 。 

大 部 分 语言 (比如 C 和 Java) 使 用 静态 作用 域 。 我 们 将 在 1.6.3 节 中 讨论 静态 作用 域 。 
作为 静态 /动态 区 别 的 另 一 个 例子 , 我 们 考虑 一 下 Java 类 声明 中 术语 static 的 使 用 。 这 
个 术语 作用 于 数据 。 在 Java 中 ,一 个 变量 是 用 于 存放 数据 值 的 某 个 内 存 位 置 的 和 名字。 这 里 ， 
“statie” 指 的 并 不 是 变量 的 作用 域 , 而 是 编译 器 确定 用 于 存放 被 声明 变量 的 内 存 位置 的 能 力 。 比 
如 声明 


public static int x; 
使 得 # 成 为 一 个 类 变量 (class variable) ,也 就 是 说 不 管 创 建 了 多 少 个 这 个 类 的 对 象 ， 只 存在 -一 个 x* 
的 拷贝 。 此 外 ,编译 器 可 以 确定 内 存 中 的 被 用 于 存放 整数 x 的 位 置 。 反 过 来 ， 如果 这 个 声明 中 省 
略 了 “static”, 那么 这 个 类 的 每 个 对 象 都 会 有 它 自 己 的 用 于 存放 x 的 位 置 , 编译 器 没有 办 法 在 运行 
程序 之 前 预先 确定 所 有 这 些 位 置 。 四 
1.6.2 环境 与 状态 

我 们 在 讨论 程序 设计 语言 时 必须 了 解 的 另 一 个 重要 区 别 是 在 程序 运行 时 发 生 的 改 侠 是 否 会 
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影响 数据 元 素 的 值 , 还 是 影响 了 对 那个 数据 的 名 字 的 解释 。 比 如 ,执行 像 x =y 41 这 样 的 赋值 
语句 会 改变 名 字 所 指 的 值 。 更 加 明确 地 说 , 这 个 赋值 改变 了 x%* 所 指向 的 内 存 位 置 上 的 值 。 

可 能 下 面 这 一 点 就 不 是 那么 明显 了 。 即 所 指 的 位 置 也 可 能 在 运行 时 刻 改 变 ，。 比 如 ,我们 在 例 
1.3 中 讨论 过 , 如 果 % 不 是 一 个 静态 (或 者 说 “类 ”) 变 量 , 那么 这 个 类 的 每 一 个 对 象 都 有 它 自 己 的 分 
配给 变量 * 的 实例 的 位 置 。 这 种 情况 下 , 对 的 赋值 可 能 会 改变 那些 “实例 "变量 中 的 某 一 个 变量 的 
值 , 这 取决 于 包含 这 个 赋值 的 方法 作用 于 哪个 对 象 。 a ie 

名 字 和 内 存 (存储 ) 位 置 的 关联 ,及 之 后 和 值 的 关联 可 以 用 两 一、、、 BEN 
个 映射 来 描述 。 这 两 个 映射 随 着 程序 的 运行 而 改变 ( 见 图 1.8)。 ， 名 学 rift tt 

1) #3 ( environment ) 是 二 个 从 名 字 到 存储 位 置 的 映射 。 
因为 变量 就 是 指 内 存 位 置 ( 即 C 语言 中 的 术语 “ 左 值 ") , 我 们 ”图 1-8 从 名 字 到 值 的 两 步 映射 
还 可 以 换 一 种 方法 , 把 环境 定义 为 从 名 字 到 变量 的 映射 。 

2) 状态 (state) 是 一 个 从 内 存 位 置 到 它们 的 值 的 映射 。 以 C 语言 的 术语 来 说 , 即 状 态 把 左 值 
映射 为 它们 的 相应 右 值 。 

环境 的 改变 需要 遵守 语言 的 作用 域 规则 。 
考虑 图 1-9 中 的 C 程序 片断 。 整 数 i 被 声明 为 一 个 全 局 变量 , 同时 也 被 声明 为 局 部 于 
函数 /的 变量 。 执 行 /时 ,环境 相应 地 调整 ,使 得 名 字 i 指向 那个 为 局 部 于 了 的 那个 i 所 保留 的 存 
EAE, E i 的 所 有 使 用 (如 图 中 明确 显示 的 赋值 语句 i =3 ) 都 指向 这 个 位 置 。 局 部 的 ;通常 被 
赋予 一 个 运行 时 刻 栈 中 的 位 置 。 

只 要 当 一 个 不 同 于 /的 函数 g 运行 时 ,i 的 使 用 就 不 能 指向 那个 局 部 于 /的 i。 在 函数 g 中 对 
BF 的 使 用 必须 位 于 其 他 某 个 对 之 的 声明 的 作用 域内 。 一 个 例子 是 图 中 明确 显示 的 赋值 语句 
xsitl, 它 位 于 某 个 其 定义 没有 在 图 中 显示 的 过 程 中 。 可 以 假定 i+1 中 的 i 指向 全 局 的 i 和 
大 多 数 语言 一 样 ，C 语言 中 的 声明 必须 先 于 其 使 用 ， — 
因此 在 全 局 i 的 声明 之 前 的 函数 不 能 指向 它 。 口 | iti; /* 全局; ay 

图 1-8 中 的 环境 和 状态 映射 是 动态 的 , 但 是 也 | a 
有 一 些 例外 。 í int i; /* E i */ 

1) 名 字 到 位 置 的 静态 绑 定 与 动态 绑 定 。 大 部 分 ee: Vee) 
从 名 字 到 位 置 的 绑 定 是 动态 的 。 我 们 在 这 -- 节 中 讨 = 
论 了 这 种 绑 定 的 几 种 方法 。 某 些 声明 ( 比如 图 19 中 | 】 
的 全 局 变量 i) 可 以 在 编译 器 生成 目标 代码 时 一 劳 永 i + 站， /* 对 全 局 ;的 使 用 */ 
逸 地 分 配 一 个 存储 位 置 .@ 

2) 从 位 置 到 值 的 静态 绑 定 与 动态 绑 定 。_ 般 来 isthe Boll aie dap) 

说 , 位 置 到 值 的 绑 定 (图 1-8 的 第 二 阶段 ) 也 是 动态 的 , 因为 我 们 无 法 在 运行 一 个 程序 之 前 指出 一 
个 位 置 上 的 值 。 被 声明 的 常量 是 一 个 例外 。 比 如 ,C 语言 的 定义 


#define ARRAYSIZE 1000 


把 名 字 ARRAYSIZE MAS HH SE E WME 1000, 我 们 看 到 这 个 语句 就 可 以 知道 这 个 绑 定 关系 ， 并且 知 
道 在 程序 运行 时 刻 这 个 绑 定 不 可 能 改变， 





日 、 从 技术 上 来 讲 , C 语言 编译 器 将 为 全 局 变量 i 分 配 一 个 虚拟 内 存 中 的 位 置 ， 而 由 程序 装载 器 和 操作 系统 来 决定 到 底 把 i 分 
配 在 机 器 的 物理 地 址 中 的 什么 地 方 。 但 是 我 们 不 用 担心 像 这 样 的 “重新 分 配 ” 问题 ,因为 它 对 编译 过 程 没有 影响 我 们 按 
照 如 下 的 方式 处 理 地 址 空间 问题 : 编译 器 在 为 它 的 输出 代码 使 用 地 址 空间 时 ,假设 它 是 在 分 配 物理 内 存 位 置 。 
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1.6.3 静态 作用 域 和 块 结构 

包括 C 语言 和 它 的 同类 语言 在 内 的 大 多 数 语言 使 用 静态 作用 域 。C 语言 的 作用 域 规则 是 基 
于 程序 结构 的 , 一 个 声明 的 作用 域 由 该 声明 在 程序 中 出 现 的 位 置 隐 舍 地 决定 。 稍 后 出 现 的 语言 ， 
比如 C++、Java AI CH, 也 通过 诸如 public, private 和 protected 等 关键 字 的 使 用 , 提供 了 对 作用 
域 的 明确 控制 。 

在 本 节 中 , 我 们 将 考虑 块 结构 语言 的 静态 作用 域 规则 ,其 中 块 (block) 是 声明 和 语句 的 一 个 组 
合 。C 使 用 括号 | 和 | 来 界定 一 个 块 。 男 一 种 为 同一 目的 使 用 begin 和 end 的 方法 可 以 追溯 到 Algol, 


<i 
名 字 、 标 识 符 和 变量 

虽然 术语 “名 字 ” 和 “变量 ”通常 指 的 是 同一 个 事物 , 我 们 还 是 要 很 小 心地 使 用 它们 , 以便 
区 别 编译 时 刻 的 名 字 和 名 字 在 运行 时 刻 所 指 的 内 存 位 置 。 

标识 符 (identifier) 是 一 个 字符 串 ,; 通常 由 字母 和 数字 组 成 。 它 用 来 指向 (标记 ) 一 个 实体 ， 
比如 一 个 数据 对 象 、 过 程 、 类 , 或 者 类 型 。 所 有 的 标识 符 都 是 名 字 , 但 并 不 是 所 有 的 名 字 都 是 
标识 符 。 名 字 也 可 以 是 一 个 表达 式 。 上 比如 名 字 x. y 可 以 表示 x 所 指 的 一 个 结构 中 的 字段 Vo 
这 里 , x 和 y 是 标识 符 , 而 x. y 是 一 个 名 字 。 像 x. y 这 样 的 复合 名 字 称 为 受 限 名 字 ( qualified 
name) 。 

变量 指向 存储 中 的 某 个 特定 的 位 置 。 同 一 个 标识 符 被 多 次 声明 是 很 常见 的 事情 , 每 一 个 
这 样 的 声明 引入 一 个 新 的 变量 。 即 使 每 个 标识 符 只 被 声明 一 次 , 一 个 递归 过 程 中 的 局 部 标识 
| 符 将 在 不 同 的 时 刻 指向 不 同 的 存储 位 置 。 














UERS C 语言 的 静态 作用 域 策 略 可 以 概述 如 下 : 

1) 一 个 C 程序 由 一 个 顶层 的 变量 和 函数 声明 的 序列 组 成 。 

2) 函数 内 部 可 以 声明 变量 , 变量 包括 局 部 变量 和 参数 。 每 个 这 样 的 声明 的 作用 域 被 限制 在 
它们 所 出 现 的 那个 函数 内 。 

3) BF a 的 一 个 顶层 声明 的 作用 域 包括 其 后 的 所 有 程序 。 但 是 如 果 一 个 函数 中 也 有 一 个 x 
的 声明 , 那么 函数 中 的 那些 语句 就 不 在 这 个 顶层 声明 的 作用 域内 。 

还 有 一 些 关于 C 语言 的 静态 作用 域 策略 的 细节 用 来 处 理 语 名 中 的 变量 声明 。 我 们 将 在 接 下 
来 的 内 容 中 , 以 及 在 例 1.6 中 查看 这 样 的 声明 。 Oo 


+ 





过 程 、 函 数 和 方法 

为 了 避免 总 是 说 “过 程 、 函 数 或 方法 ”, 每 次 我 们 要 讨论 一 个 可 以 被 调用 的 子 程序 时 , 我 
们 通常 把 它们 统称 为 过程”。 但 是 当 明确 地 讨论 某 个 语言 (比如 C) 的 程序 时 有 一 个 例外 。 因 
为 5 语言 只 有 函数 , 所 以 我 们 把 它们 称 为 “函数 " 。 或 者 ,如 果 我 们 讨论 像 Java 这 样 的 只 有 
“方法 "的 语言 时 , 我 们 就 使 用 这 个 术语 。 

一 个 函数 通常 返回 某 个 类 型 ( 即 “返回 类 型 ”) 的 值 , 而 一 个 过 程 不 返回 任何 值 。C 和 类 似 
的 语言 只 有 函数 , 因此 它们 把 过 程 当 作 是 具有 特殊 返回 类 型 “void" 的 函数 来 处 理 。 “void” X 
示 没 有 返回 值 。 像 Java 和 C ++ DORAN TTR FRI DTE”, 这 些 方法 可 以 像 函数 
或 者 过 程 一 样 运行 , 但 是 总 是 和 某 个 特定 的 类 相关 联 。 











在 C 语言 中 , 有 关 块 的 语法 如 下 : 
1) 块 是 一 种 语句 。 块 可 以 出 现在 其 他 类 型 的 语句 ( 比如 赋值 语句 ) 所 能 够 出 现 的 任何 地 方 。 
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2) 一 个 块 包含 了 一 个 声明 的 序列 ,然后 再 跟着 一 个 语句 序列 。 这 些 声明 和 语句 用 一 对 括号 
包围 起 来 。 

注意 , 这 个 语法 允许 一 个 块 嵌 套 在 另 一 个 块 内 。 这 个 说 套 特性 称 为 块 结构 (block structure) o 
C 族 语言 都 具有 块 结构 ,但 是 不 能 在 一 个 函数 内 部 定义 另 一 个 函数 。 

如 果 块 B 是 包含 声明 D 的 最 内 层 的 块 , 那么 我 们 说 D 属于 B。 也 就 是 说 , D 在 8 中 , 且 不 在 
RETF B 中 的 任何 其 他 块 中 。 

在 一 个 块 结构 语言 中 , 关于 变量 声明 的 静态 作用 域 规则 如 下 。 如 果 名 字 x 的 声明 D 属于 块 
B, IA D 的 作用 域 包括 整个 B, 但 是 以 任意 深度 嵌 套 在 巨 中 、 重 新 声明 了 s 的 所 有 块 B' 不 在 此 
作用 域 中 。 这 里 , x 在 8' 中 重新 声明 是 指 存在 男 一 个 属于 8' 的 对 相同 名 字 x 的 声明 D. 

另 一 个 等 价 的 表达 这 个 规则 的 方法 着 眼 于 名 字 * 的 一 次 使 用 。 设 By, Ba, +, Bi 是 所 有 的 
包含 了 x 的 该 次 使 用 的 块 。 其中, By REE BiH, BREE Bi 中, …, 依 此 类 推 。 寻 找 
最 大 的 满足 下 面条 件 的 i 存在 一 个 属于 B; 的 * 的 声明 。 本 次 对 * 的 使 用 就 是 指向 B; 中 对 x 的 声 
明 。 换 句 话说 , x 的 本 次 使 用 在 B; 中 的 这 个 声明 的 作用 域内 。 

在 图 1-10 中 的 C++ 程 序 有 四 个 块 , 其 中 包含 了 变量 a 和 5 的 几 个 定义 。 为 了 帮助 记 
忆 , 每 个 声明 把 其 变量 初始 化 为 它 
所 属于 的 那个 块 的 编号 。 main0 A 






































比如 , 考虑 志 Bi 中 的 声明 int a-1。 | 这 和 B | 
它 的 作用 域 包括 整个 Bi ,当然 那些 (可 能 很 。 |{ 一 4 
Yeh) STE B, 中 并 且 有 它 自己 的 对 a 的 i ; ik 
声明 的 块 除外 。 直 接 嵌 套 在 B 中 的 B, 没 eh ae 
有 a 的 声明 , TB, MA. B, 没有 a 的 声 } 
明 。 因 此 块 B 是 整个 程序 中 唯一 位 于 名 字 EVE B.) 
“在 B 中 的 声明 的 作用 域 之 外 的 地 方 。 也 UNSERE i 
就 是 说 , 这 个 作用 域 包括 B, 和 B 中 除了 (cout << a << b; 
B, 之 外 的 所 有 部 分 。 关 于 程序 中 的 全 部 五 Cone cca ce by 
个 声明 的 作用 域 的 总 结 见 图 1-11。 ami 
从 另 一 个 角度 看 , 让 我 们 考虑 块 B4 中 BAO ANG SF Rae 


的 输出 语句 , 并 把 那里 使 用 的 变量 a 和 4b 和 
适当 的 声明 绑 定 。 包 含 该 语句 的 块 的 列表 
从 小 到 大 是 Bi B; Bio 请 注意 ， B3 没有 
包含 问题 中 所 提 到 的 点 。B4 有 一 个 的 声 
BA, 因此 该 语句 中 对 b 的 使 用 被 绑 定 到 这 个 
声明 , 因此 打印 出 来 的 4。 的 值 是 4。 然 而 ， 
B, 没有 a 的 声明 ,因此 我 们 接着 看 B,。 这 














个 块 也 没有 a 的 声明 ,因此 我 们 继续 看 Bi. 图 1-11 例 1.6 中 的 声明 的 作用 域 
幸运 的 是 , 这 个 块 有 一 个 声明 int a = 1。 因 此 , 打印 出 来 的 a 的 值 是 1。 如 果 没 有 这 个 声明 ， 
程序 就 是 错误 的 。 


1.6.4 显 式 访问 控制 
类 和 结构 为 它们 的 成 员 引 入 了 新 的 作用 域 。 如 果 是 一 个 具有 字段 (成 员 )x 的 类 的 对 象 , BB 
LHE p. x 中 对 % 的 使 用 指 的 是 这 个 类 定义 中 的 字段 x。 和 块 结 构 类 似 , 类 C 中 的 一 个 成 员 声 明 x 
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的 作用 域 可 以 扩展 到 所 有 的 子 类 C, 除非 C' 有 一 个 本 地 的 对 同一 名 字 % 的 声明 。 

通过 public, private 和 protected 这 样 的 关键 字 的 使 用 , RC ++ 或 Java 这 样 的 面向 对 象 语言 
提供 了 对 超 类 中 的 成 员 和 名 字 的 显 式 访问 控制 。 这 些 关键 字 通 过 限制 访问 来 支持 封装 (encapsula- 
tion) 。 因 此 ,私有 (private) 名 字 被 有 意 地 限定 了 作用 域 , 这 个 作用 域 仅仅 包含 了 该 类 和 “ 友 类 ” 
(C++ 的 术语 ) 相关 的 方法 声明 和 定义 。 被 保护 的 (protected) 名 字 可 以 由 子 类 访问 , 而 公共 的 
( public) 名 字 可 以 从 类 外 访问 。 

在 C++ 中 , 一 个 类 的 定义 可 能 和 它 的 部 分 或 全 部 方法 的 定义 分 离 。 因 此 对 于 一 个 和 类 C 相 
关联 的 名 字 x, 可 能 存在 一 个 在 它 作 用 域 之 外 的 代码 区 域 , 然后 又 跟着 一 个 在 它 作用 域内 的 代码 
区 域 (一 个 方法 定义 )。 实 际 上 , 在 这 个 作用 域 之 内 和 之 外 的 代码 区 域 可 能 相互 交替 ,直到 所 有 
的 方法 都 被 定义 完毕 。 








声明 和 定义 

程序 设计 语言 概念 中 的 两 个 看 起 来 相似 的 术语 “声明 ”和 “定义 ”实际 上 有 着 很 大 的 不 同 。 声 
明 告 诉 我 们 事物 的 类 型 ,而 定义 告诉 我 们 它们 的 值 。 因 此 ,int i 是 一 个 i 的 声明 , 而 i =1 是 ;i 
的 一 个 定义 ( 定 值 ) 。 

当 我 们 处 理 方法 或 者 其 他 过 程 时 , 这 个 区 别 就 更 加 明显 。 在 C++ 中 , 通过 给 出 了 方法 
的 参数 及 结果 的 类 型 (通常 称 为 该 方法 的 范 型 ), 在 类 的 定义 中 声明 这 个 方法 。 然 后 ,这 个 
方法 在 另 一 个 地 方 被 定义 , 即 在 男 一 个 地 方 给 出 了 执行 这 个 方法 的 代码 。 类 似 地 ,我 们 会 经 
常 看 到 在 一 个 文件 中 定义 了 一 个 C 语言 的 函数 ,然后 在 其 他 使 用 这 个 函数 的 文件 中 声明 这 
个 函数 。 








1.6.5 动态 作用 域 
从 技术 上 讲 , 如 果 一 个 作用 域 策略 依赖 于 一 个 或 多 个 只 有 在 程序 执行 时 刻 才能 知道 的 因素 ， 
它 就 是 动态 的 。 然 而 , 术语 动态 作用 域 通常 指 的 是 下 面 的 策略 : 对 一 个 名 字 * 的 使 用 指向 的 是 最 
近 被 调用 但 还 没有 终止 且 声 明了 % 的 过 程 中 的 这 个 声明 。 这 种 类 型 的 动态 作用 域 仅仅 在 一 些 特 
殊 情况 下 才 会 出 现 。 我 们 将 考虑 两 个 动态 作用 域 的 例子 : C 预 处 理 器 中 的 宏 扩展 ,以 及 面向 对 象 
编程 中 的 方法 解析 。 
在 图 1-12 给 出 的 C 程序 中 , 标识 符 a 是 一 个 代表 了 表达 式 (x + 的 安 但 到底 是 什 
ADE? 我 们 不 能 够 静态 地 (也 就 是 说 通过 程序 文本 ) 解 析 x。 
实际 上 , 为 了 解析 x, 我 们 必须 使 用 前 面 提 
到 的 普通 的 动态 作用 域 规则 。 我 们 检查 所 有 当 
前 活跃 的 函数 调用 ,然后 选择 最 近 调 用 的 且 具 
有 一 个 对 * 的 声明 的 函数 S。 对 x 的 使 用 就 是 指 


#define a (x+1) 
int x = 2; 


void b() { int x = 1; printf("%d\n", a); } 


wee void c(Q) { printf("%d\n", a); + 
向 这 个 声明 。 void main() { bO; c0; } 


在 图 1-12 的 例子 中 ,函数 main 首先 调用 函 
数 5。 当 5 执行 时 打印 宏 a 的 值 。 因 为 首先 必须 ”图 1-12 一 个 其 名 字 的 作用 域 必须 动态 确定 的 宏 








, © 这 个 规则 可 能 只 对 当前 的 例子 成 立 。 如 果 将 图 1-12 的 例子 中 的 函数 & 改 成 void b() {int x =1; printf 
("% d\n", a); c(); }, 那么 当 main 函数 调用 函数 b, 函数 b 又 调用 c 的 时 候 , c 中 的 printf("% d\n", a) 语 句 
依然 打印 值 2。 即 此 时 对 % 的 使 用 对 应 的 仍然 是 全 局 的 x, 而 不 是 按照 规则 确定 的 函数 5， 即 “最 近 调 用 的 且 有 一 - 
个 对 x 的 声明 的 函数 ”。 译 者 注 
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用 (x+1) 替 换 掉 a, 所 以 我 们 把 本 次 对 % 的 使 用 解析 为 对 函数 5 中 的 声明 int x=1。 原 因 是 6 有 
一 个 “的 声明 , 因此 5 中 的 printf 中 的 (x+1) 指 向 这 个 x。 因 此 ;3 打印 出 的 值 是 2。 

在 6 运行 结束 之 后 , 函数 被 调用 , 我 们 依旧 需要 打印 宏 a 的 值 。 然 而 ,唯一 可 以 被 访问 
的 x 是 全 局 变量 x。 函数 c 中 的 printf 语句 指向 x 的 这 个 声明 , 且 被 打印 的 值 是 3。 口 

动态 作用 域 解析 对 多 态 过 程 是 必 不 可 少 的。 所 谓 多 态 过 程 是 指 对 于 同一 个 名 字 根 据 参 数 
类 型 具有 两 个 或 多 个 定义 的 过 程 。 在 有 些 语言 中 , 比如 ML( 见 7.3.3 99), 人 们 可 以 静态 地 确 
定名 字 所 有 使 用 的 类 型 。 在 这 种 情况 下 , 编译 器 可 以 把 每 个 名 字 为 p 的 过 程 蔡 换 为 对 相应 的 
过 程 代 码 的 引用 。 但 是 , 在 其 他 语言 中 ,比如 在 Java 和 C ++ 中， 编译 器 有 时 不 能 够 做 出 这 样 
的 决定 。 
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静态 作用 域 和 动态 作用 域 的 类 比 
虽然 可 以 有 各 种 各 样 的 静态 或 者 动态 作用 域 策 略 , 在 通常 的 ( 块 结构 的 ) 静 态 作用 域 规则 
和 通常 的 动态 策略 之 间 有 一 个 有 趣 的 关系 。 从 某 种 意义 上 说 , 动态 规则 处 理 时 间 的 方式 类 似 
于 静态 作用 域 处 理 空间 的 方式 。 静 态 规 则 让 我 们 寻找 的 声明 位 于 最 内 层 的 、 包 含 变 量 使 用 位 
置 的 单元 ( 块 ) 中 ; 而 动态 规则 让 我 们 寻找 的 声明 位 于 最 内 层 的 、 包 含 了 变量 使 用 时 间 的 单元 
(过 程 调用 ) 中 。 

















DE 而 向 对 象 语言 的 一 个 突出 特征 就 是 每 个 对 象 能 够 对 一 个 消息 做 出 适当 反应 ,调用 相应 
的 方法 。 换 句 话说 , 执行 *.m( ) 时 调用 哪个 过 程 要 由 当时 * 所 指向 的 对 象 的 类 来 决定 。 一 个 典型 
的 例子 如 下 : 

1) 有 一 个 类 C, 它 有 一 个 名 字 为 m( ) 的 方法 。 

2) D 是 C 的 一 个 子 类 , 而 D 有 一 个 它 自己 的 名 字 为 m( ) 的 方法 。 

3) 有 一 个 形 如 %.m( ) 的 对 x 的 使 用 , 其 中 x 是 类 C 的 一 个 对 象 。 

正常 情况 下 , 在 编译 时 刻 不 可 能 指出 x 指向 的 是 类 C 的 对 象 还 是 其 子 类 D 的 对 象 。 如 果 这 
个 方法 被 多 次 应 用 , 那么 很 可 能 某 些 调用 作用 在 由 * 指向 的 类 C 的 对 象 , 而 不 是 类 D HOW, 而 
其 他 调用 作用 于 类 D 的 对 象 之 上 。 只 有 到 了 运行 时 刻 才 可 能 决定 应 当 调用 m 的 哪个 定义 。 因 
此 , 编译 器 生成 的 代码 必须 决定 对 象 * 的 类 , 并 调用 其 中 的 某 一 个 名 字 为 m 的 方法 。 口 
1.6.6 参数 传递 机 制 

所 有 的 程序 设计 语言 都 有 关于 过 程 的 概念 ,但 是 在 这 些 过 程 如 何 获取 它们 的 参数 方面 , 不 同 
的 语言 之 间 有 所 不 同 。 在 本 节 , 我 们 将 考虑 实在 参数 (在 调用 过 程 时 使 用 的 参数 ) 是 如 何 与 形式 
参数 (在 过 程 定义 中 使 用 的 参数 ) 关联 起 来 的 。 使 用 哪 一 种 传递 机 制 决定 了 调用 代码 序列 如 何 处 
理 参 数 。 大 多 数 语言 要 么 使 用 “ 值 调用 ”, 要 么 使 用 “引用 调用 ”, 或 者 两 者 都 用 。 我 们 将 解释 这 
些 术语 以 及 另 一 个 被 称 为 “名 调用 ”的 方法 ， 解释 后 者 主要 是 基于 对 历史 的 兴趣 。 

值 调 用 

在 值 调用 (call-by-value) F, 会 对 实在 参数 求 值 (如 果 它 是 表达 式 ) 或 拷贝 (如 果 它 是 变量 ) 。 
这 些 值 被 放 在 属于 被 调用 过 程 的 相应 形式 参数 的 内 存 位 置 上 。 这 种 方法 在 C 和 Java 中 使 用 , 也 
是 C++ 语言 及 大 部 分 其 他 语言 的 一 个 常用 选项 。 值 调用 的 效果 是 ,被 调用 过 程 所 做 的 所 有 有 关 
形式 参数 的 计算 都 局 限于 这 个 过 程 ， 相 应 的 实在 参数 本 身 不 会 被 改变 。 

然而 请 注意 , 在 C 语 言 中 我 们 可 以 传递 变量 的 一 个 指针 ,使 得 该 变量 的 值 能 够 被 被 调用 
者 修改 。 同 样 ，C、C ++ Al Java 中 作为 参数 传递 的 数组 名 字 实际 上 向 被 调用 过 程 传递 了 一 个 
指向 该 数组 本 身 的 指针 或 引用 。 因 此 ,如 果 a 是 调用 过 程 的 一 个 数组 的 名 字 ,， 且 它 被 以 值 调用 
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的 方式 传递 给 相应 的 形式 参数 x, 那么 像 x[2] = 1 这 样 的 赋值 语句 实际 上 改变 了 数组 元 素 a[i]。 
原因 是 虽然 x 是 a 的 值 的 一 个 拷贝 ,但 这 个 值 实际 上 是 一 个 指针 , 指向 被 分 配给 数组 a 的 存储 区 
域 的 开始 处 。 

类 似 地 ,Java 中 的 很 多 变量 实际 上 是 对 它们 所 代表 的 事物 的 引用 , 或 者 说 指针 。 这 个 结论 对 
数组 、 字 符 串 和 所 有 类 的 对 象 都 有 效 。 虽 然 Java 只 使 用 值 调用 , 但 只 要 我 们 把 一 个 对 象 的 名 字 传 
递 给 一 个 被 调用 过 程 , 那个 过 程 收 到 的 值 实际 上 是 这 个 对 象 的 指针 。 因 此 , 被 调用 过 程 是 可 以 改 
变 这 个 对 象 本 身 的 值 的 。 

引用 调用 

在 引用 调用 (call-by-reference) 中 , 实在 参数 的 地 址 作为 相应 的 形式 参数 的 值 被 传递 给 被 调用 
者 。 在 被 调用 者 的 代码 中 使 用 形式 参数 时 , 实现 方法 是 沿 着 这 个 指针 找到 调用 者 指明 的 内 存 位 
置 。 因 此 , 改变 形式 参数 看 起 来 就 像 是 改变 了 实在 参数 一 样 。 

但 是 , 如 果实 在 参数 是 一 个 表达 式 , 那么 在 调用 之 前 首先 会 对 表达 式 求 值 , 然后 它 的 值 被 
存放 在 一 个 该 值 自己 的 位 置 上 。 改 变形 式 参 数 会 改变 这 个 位 置 上 的 值 , 但 对 调用 者 的 数据 没 
有 影响 。 

C++ 中 的 “ref” 参 数 使 用 的 是 引用 调用 。 而 在 很 多 其 他 语言 中 ,引用 调用 也 是 二 种 选项 。 当 
形式 参数 是 一 个 大 型 的 对 象 、 数 组 或 结构 时 , 引用 调用 几乎 是 必 不 可 少 的 。 原 因 是 严格 的 值 调用 
要 求 调用 者 把 整个 实在 参数 拷贝 到 属于 相应 形式 参数 的 空间 上 。 当 参数 很 大 时 , 这 种 拷贝 可 能 
代价 高 昂 。 正 如 我 们 在 讨论 值 调用 时 所 指出 的 ， 像 Java 这 样 的 语言 解决 数组 、 字 符 串 和 其 他 对 象 
的 参数 传递 问题 的 方法 是 仅仅 复制 这 些 对 象 的 引用 。 结 果 是 ， Java 运行 时 就 好 像 它 对 所 有 不 是 基 
本 类 型 ( 比如 整数 、 实 数 等 ) 的 参数 都 使 用 了 引用 调用 。 

名 调用 

第 三 种 机 制 一 一 名 调用 一 一 被 早期 的 程序 设计 语言 Algol 60 使 用 。 它 要 求 被 调用 者 的 运行 
方式 好 像 是 用 实在 参数 以 字面 方式 蔡 换 了 被 调用 者 的 代码 中 的 形式 参数 一 样 。 这 么 做 就 好 像 形 
式 参 数 是 一 个 代表 了 实在 参数 的 宏 。 当 然 被 调用 过 程 的 局 部 名 字 需 要 进行 重 命名 ,以便 把 它们 
和 调用 者 中 的 名 字 区 别 开 来 。 当 实在 参数 是 一 个 表达 式 而 不 是 一 个 变量 时 , 会 发 生 一 些 和 直觉 
不 符 的 问题 。 这 也 是 今天 不 再 采用 这 种 机 制 的 原因 之 一 。 

1.6.7 别名 

引用 调用 或 者 其 他 类 似 的 方法 ,比如 像 Java 中 那样 把 对 象 的 引用 当 作 值 传递 , 会 引起 一 个 有 
趣 的 结果 。 有 可 能 两 个 形式 参数 指向 同一 个 位 置 , 这 样 的 变量 称 为 另 一 个 变量 的 别名 (alias) 。 
结果 是 , 任意 两 个 看 起 来 从 两 个 不 同 的 形式 参数 中 获得 值 的 变量 也 可 能 变 成 对 方 的 别名 。 

URDA 假设 a 是 一 个 属于 某 个 过 程 p 的 数组 , 且 p 通过 调用 语句 g(a, a) 调 用 了 男 一 个 过 程 

alx, y)o FERR C 语言 或 类 似 的 语言 那样 , 参数 是 通过 值 传递 的 , 但 数组 名 实际 上 是 指向 数 
组 存放 位 置 的 引用 。 现 在 , x 和 y 变 成 了 对 方 的 别名 。 要 点 在 于 ， 如 果 9 中 有 一 a 
x[10] =2, 那么 y[10] 的 值 也 是 2。 

事实 上 ， 如 采编 译 器 要 优化 一 个 程序 ,就 要 理解 别名 现象 以 及 产生 这 一 现象 的 机 制 。 ae 
们 从 第 9 章 看 到 的 , 在 很 多 情况 下 我 们 必须 在 确认 某 些 变量 相互 之 间 不 是 别名 之 后 才 可 以 优化 程 
序 。 比 如 , 我 们 可 能 确定 x =2 是 变量 e 唯一 被 赋值 的 地 方 。 如 果 是 这 样 ， ABA BAT FT VASE Mt x 
GER 2 的 使 用 。 比 如 , 把 a =x +3 替换 为 较 简单 的 a =5。 但 是 ， 假设 有 另 一 个 变量 y 
是 x 的 别名 。 那 么 ,一 个 赋值 语句 y =4 可 能 具有 意 想不到 的 改变 * 的 值 的 效果 。 这 可 能 也 意味 
着 把 a =x+3 替换 为 a =5 是 一 个 错误 , 此 时 , a 的 正确 值 可 能 是 7。 
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1.6.8 


1.6 节 的 练习 


练习 1. 6.1: 对 图 1-13a 中 的 块 结构 的 C 代码 , 指出 赋 给 w、x、y 和 = 的 值 。 


练习 1.6.2: 对 图 1-13b 中 的 代码 重复 练习 1.6.1. 

练习 1.6.3: 对 于 图 1-14 中 的 块 结构 代码 , 假设 使 
用 常见 的 声明 的 静态 作用 域 规则 , 给 出 其 中 12 个 声明 
中 的 每 一 个 的 作用 域 。 

练习 1.6.4: 下 面 的 C 代码 的 打印 结果 是 什么 ? 


#define a (x+1) 


int w, X, y, Z; int wy’ Xs) ¥3 iz; 
int i = 4; int j = 5; int i = 3; int j = 4; 








a) 练习 1.6.1 的 代码 b) 练习 1.6.2 的 代码 
图 1-13 块 结构 代码 





int x = "2; 

void bO { x = ai prints("%a\n", x); } 图 1.14 练习 1.6.3 的 块 结构 代码 
void cO { int x = 1; printf("%d\n", a) ; } 

void main() { bO; cO; } 


1.7 第 1 章 总 结 


语言 处 理 器 : 一 个 集成 的 软件 开发 环境 ,其 中 包括 很 多 种 类 的 语言 处 理 器 ， 比 如 编译 器 、 
解释 器 、 汇 编 器 、 连 接 器 、 加 载 器 、 调 试 器 以 及 程序 概要 提取 工具 。 

编译 器 的 步骤 : 一 个 编译 器 的 运作 需要 一 系列 的 步骤 , 每 个 步骤 把 源 程序 从 一 个 中 间 表 
示 转 换 成 为 男 一 个 中 间 表 示 。 

机 器 语言 和 汇编 语言 : 机 器 语言 是 第 一 代 程 序 设 计 语 言 , 然后 是 汇编 语言 。 使 用 这 些 语 
言 进行 编程 既 费 时 , 又 容易 出 错 。 

编译 器 设计 中 的 建 模 : 编译 器 设计 是 理论 对 实践 有 很 大 影响 的 领域 之 一 。 已 知 在 编译 器 
设计 中 有 用 的 模型 包括 自动 机 、 文 法 、 正 则 表达 式 、 树 型 结构 和 很 多 其 他 理论 概念 。 

代码 优化 : 虽然 代码 不 能 真正 达到 最 优化 , 但 提高 代码 效率 的 科学 既 复杂 又 非常 重要 。 
它 是 编译 技术 研究 的 一 个 主要 部 分 。 

高 级 语言 : 随 着 时 间 的 流逝 , 程序 设计 语言 担负 了 越 来 越 多 的 原先 由 程序 员 负 责 的 任务 ， 
比如 内 存 管理 、 类 型 一 致 性 检查 或 代码 的 并 发 执行 。 

编译 器 和 计算 机 体系 结构 : 编译 器 技术 影响 了 计算 机 的 体系 结构 ,同时 也 受到 体系 结构 
发 展 的 影响 。 体 系 结构 中 的 很 多 现代 创新 都 依赖 于 编译 器 能 够 从 源 程序 中 抽取 出 有 效 利 
用 硬件 能 力 的 机 会 。 

软件 生产 率 和 软件 安全 性 : 使 得 编译 器 能 够 优化 代码 的 技术 同样 能 够 用 于 多 种 不 同 的 程 
序 分 析 任务 。 这 些 任务 既 包 括 探测 常见 的 程序 错误 , 也 包括 发 现 程序 可 能 会 受到 已 被 黑 


a g 


客 们 发 现 的 多 种 入 侵 方式 之 一 的 伤害 。 
© 作用 域 规则 : 一 个 % 的 声明 的 作用 域 是 一 段 上 下 文 , 在 此 上 下 文中 对 % 的 使 用 指向 这 个 声 
明 。 如 果 仅仅 通过 阅读 某 个 语言 的 程序 就 可 以 确定 其 作用 域 , 那么 这 个 语言 就 使 用 了 静 
态 作 用 域 ,或 者 说 词法 作用 域 。 否 则 这 个 语言 就 使 用 了 动态 作用 域 。 
。 环境 : 名 字 和 内 存 位 置 关联 , 然后 再 和 值 相 关联 。 这 个 情况 可 以 使 用 环境 和 状态 来 描述 。 
其 中 环境 把 名 字 映 射 成 为 存储 位 置 , 而 状态 则 把 位 置 映射 到 它 的 值 。 
o RAW: 允许 语句 块 相互 嵌 套 的 语言 称 为 块 结构 的 语言 。 假 设 一 个 块 中 有 一 个 的 声明 
D, 而 嵌 套 于 这 个 块 中 的 块 B8 中 有 一 个 对 名 字 x 的 使 用 。 如 果 在 这 两 个 块 之 间 没 有 其 他 声 
明了 x 的 块 , 那么 这 个 % 的 使 用 位 于 D 的 作用 域内 。 
© 参数 传递 ; 参数 可 以 通过 值 或 引用 的 方式 从 调用 过 程 传递 给 被 调用 过 程 。 当 通过 值 传 弟 
方式 传递 大 型 对 象 时 , 实际 被 传递 的 值 是 指向 这 些 对 象 本 身 的 引用 。 这 样 就 变 成 了 一 个 
高 效 的 引用 调用 。 
。 别名 : 当 参 数 被 以 引用 传递 方式 (高 效 地 ) 传 递 时 , 两 个 形式 参数 可 能 会 指向 同一 个 对 象 。 
这 会 造成 一 个 变量 的 修改 改变 了 另 一 个 变量 的 值 。 


1.8 第 1 章 参考 文献 
对 于 在 1967 年 之 前 被 开发 并 使 用 的 程序 设计 语言 (包括 Fortran, Algol, Lisp 和 Simula) 的 发 


展 历程 见 [7] 。 对 于 1982 年 前 被 创建 的 语言 (包括 C、C ++ 、Pascal 和 Smalltalk) 见 [1]。 
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GNU 编译 器 集合 gcc( GNU Compiler Collection) Œ C, C ++, Fortran, Java 和 其 他 语言 的 开源 
编译 器 的 流行 源头 [2] Phoenix 是 一 个 编译 器 构造 工具 包 , 它 提 供 了 一 个 集成 的 框架 , 用 于 建立 
本 书 中 提 到 的 编译 器 的 程序 分 析 、 代 码 生成 和 代码 优化 步骤 [3] 。 

要 获取 更 多 的 关于 程序 设计 语言 概念 的 信息 , 我 们 推荐 [5, 6] 。 要 知道 更 多 的 关于 计算 机 体 
系 结构 信息 , 以 及 体系 结构 是 如 何 影 响 编译 的 , 我 们 建议 阅读 [4]。 : 
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第 2 章 ， 一 个 简单 的 语法 制导 翻译 器 


本 章 的 内 容 是 对 本 书 第 3 章 至 第 6 章 中 介绍 的 编译 技术 的 总 体 介 绍 。 通 过 开发 一 个 可 运行 
的 Java 程序 来 演示 这 些 编译 技术 。 这 个 程序 可 以 将 具有 代表 性 的 程序 设计 语言 语句 翻译 为 三 地 
址 代码 (一 种 中 间 表示 形式 ) 。 本 章 的 重点 是 编译 器 的 前 端 , 特别 是 词法 分 析 、 语法 分 析 和 中 间 
代码 生成 。 在 第 7 章 和 第 8 章 将 介绍 如 何 根据 三 地 址 代码 生成 机 器 指令 。 

我 们 从 小 事 做 起 , 首先 建立 一 个 能 够 将 中 级 算术 表达 式 转换 为 后 缀 表达 式 的 语法 制导 翻译 
器 。 然 后 我 们 将 扩展 这 个 翻译 器 , 使 它 能 将 某 些 程序 片段 (如 图 2-1 所 示 ) 转 换 为 如 图 2-2 所 示 的 
三 地 址 代码 。 


int i; int j; float[100] a; float v; float x; 


while ( true ) { 
do i = i+1; while ( ali] < v ); 
do j = j-1; while ( alj] > v ); 
if ( i >= j ) break; 
x = ali}; alil = aljl; alj? = x; 
} 





图 2-1 一 个 将 被 翻译 的 代码 片段 


这 个 可 运行 的 Java 程序 见 附录 A (EH Java 比较 方便 , 但 并 非 必须 用 Java。 实际 土 , 本 章 中 
描述 的 思想 在 Java 和 C 语言 出 现 之 前 就 存在 了 。 


i =i. +1 

thara Fint 

if t1 < v goto 1 
PRIER 
t2=a[j] 

if t2 > v goto 4 

: ifFalse i >= j goto 9 


2.1 Sf 


编译 器 在 分 析 阶 段 把 一 个 源 程序 划分 成 各 个 组 成 部 分 ， 
并 生成 源 程序 的 内 部 表示 形式 。 这 种 内 部 表示 称 为 中 间 代 
码 。 然 后 ， 编 译 器 在 合成 阶段 将 这 个 中 间 代 码 翻 译 成 目标 
程序 。 

分 析 阶 段 的 工作 是 围绕 着 待 编译 语言 的 “语法 ”展开 的 。 
一 个 程序 设计 语言 的 语法 (syntax ) 描述 了 该 语言 的 程序 的 正 
确 形式 , 而 该 语言 的 语义 (semantics) 则 定义 了 程序 的 含义 , 即 
广 范 使 用 的 表示 方法 来 描述 语法 ， 这 个 方法 就 是 上 下 文 无 关 经过 简化 的 中 间 代 码 志 
文法 或 BNF( Backus-Naur 范式 ) 。 使 用 现 有 的 语义 表示 方法 来 
描述 一 个 语言 的 语义 的 难度 远 远 大 于 描述 语言 的 语法 的 难度 。 因此 , 我 们 将 结合 非 形式 化 描述 
和 启发 性 的 示例 来 描述 语言 的 语义 。 

上 下 文 无 关 文法 不 仅 可 以 描述 一 个 语言 的 语法 ， 还 可 以 指导 程序 的 翻译 过 程 。 在 2.3 节 中 ， 
我 们 将 介绍 一 种 面向 文法 的 编译 技术 ， 即 语法 制导 翻译 ( syntax-directed translation) 技术 。 语 法 扫 
描 , 或 者 说 语法 分 析 , 将 在 2.4 节 中 介绍 。 
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本 章 的 其 余部 分 将 快速 浏览 一 下 图 23 所 示 的 编译 器 前 端 模型 。 我 们 将 首先 介绍 语法 分 析 
器 。 为 简单 起 见 , 我 们 首先 考虑 从 中 缀 表达 式 到 后 级 表达 式 的 语法 制导 翻译 过 程 。 后 缀 表达 式 
是 一 种 将 运算 符 置 于 运算 分 量 之 后 的 表示 方法 。 例如, 表达 式 9 =5 +2 的 后 级 形式 是 95 -2 +。 
将 表达 式 翻译 为 后 缀 形式 的 过 程 可 以 充分 演示 语法 分 析 技术 ,同时 这 个 翻译 过 程 又 很 简单 ,我 们 
将 在 2.5 节 中 给 出 这 个 翻译 器 的 全 部 程序 。 这 个 简单 的 翻译 器 处 理 的 表达 式 是 由 加 、 减 号 分 隔 的 
数位 序列 , 如 9 -5+2。 我 们 之 所 以 先 考 虑 这 样 的 简单 表达 式 , 主要 目的 是 简化 这 个 语法 分 析 器 ， 
使 得 它 在 处 理 运 算 分 量 和 运算 符 时 只 需要 考虑 单个 字符 。 

生成 器 









法 分 析 树 







图 2-3 一 个 编译 器 前 端的 模型 


词法 分 析 器 使 得 翻译 器 可 以 处 理由 多 个 字符 组 成 的 构造 ， 比 如 标识 符 。 标 识 符 由 多 个 字符 
组 成 , 但 是 在 语法 分 析 阶 段 被 当 作 一 个 单元 进行 处 理 。 这 样 的 单元 称 作词 法 单元 (token) 。 例 如 ， 
在 表达 式 count +1 P, 标识 符 count 被 当 作 一 个 单元 。2. 6 节 中 介绍 的 词法 分 析 器 允许 表达 式 中 


出 现 数值 、 标 识 符 和 "空白 字符 ”( 空 格 、 do-while 
制 表 符 和 换行 符 ) 。 Lo 
接 下 来 我 们 考虑 中 间 代 码 的 生成 。 | TA 
在 图 2-4 中 显示 了 两 种 中 间 代 码 形式 。 一 a bay v A, 
种 称 为 抽象 语法 树 (abstract syntax tree), í ee eee 
或 简称 为 语法 树 (syntax tree) 。 它 表示 了 AEN 3: if ti < v goto 1 


源 程序 的 层次 化 语法 结构 。 在 图 2-3 的 模 } 
型 中 , 语法 分 析 器 生成 一 棵 语法 树 ， 它 又 

被 进一步 翻译 为 三 地 址 代码 。 有 些 编译 图 2-4 “do i =i+1; while(a[i] <v);” 的 中 间 代 码 
器 会 将 语法 分 析 和 中 间 代 码 生 成 合并 为 一 个 组 件 。 

图 2-4a 中 的 抽象 语法 树 的 根 表 示 整 个 do-while 循环 。 根 的 左 子 树 表 示 循 环 的 循环 体 , CAL 
包含 赋值 语句 ;=i+1;， 根 的 右 子 树 表示 循环 控制 条 件 ao[?] <v。 在 2.8 节 中 将 介绍 一 个 构造 语 
法 树 的 方法 。 

图 2-4b 中 给 出 了 另 一 种 常见 的 中 间 表 示 形 式 , 它 是 一 组 “三 地 址 ”指令 序列 , 图 2-2 中 显示 
了 一 个 更 加 完整 的 示例 。 这 个 中 间 代 码 形式 的 名 字源 于 它 的 指令 形式 : x =y op z, 其 中 op 是 一 
个 二 目 运 算 符 , y Mz 是 运算 分 量 的 地 址 , * 是 运算 结果 的 存放 地 址 。 三 地 址 指令 最 多 只 执行 一 
个 运算 , 通常 是 计算 、 比 较 或 者 分 支 跳 转运 算 。 

在 附录 A 中 , 我 们 将 把 本 章 中 的 技术 集成 在 一 起 , 构造 出 一 个 用 Java 语言 编写 的 编译 器 前 
端 。 这 个 前 端 将 语句 翻译 成 汇编 级 的 指令 序列 。 


2.2 语法 定义 


在 这 一 节 , 我 们 将 介绍 一 种 用 于 描述 程序 设计 语言 语法 的 表示 方法 一 一 “上 下 文 无 关 文法 ”， 
或 简称 “文法 ”。 在 本 书 中 , 文法 将 被 用 于 组 织 编译 器 前 端 。 


a) b) 
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文法 自然 地 描述 了 大 多 数 程序 设计 语言 构造 的 层次 化 语法 结构 。 例 如 ,Java 中 的 if-else 语句 

通常 具有 如 下 形式 
if (expression) statement else statement 
即 一 个 if-else 语句 由 关键 字 站 , 左 括号 、 表达 式 、 右 括号 、 一 个 语句 、 关 键 字 else 和 男 一 个 语句 连 
接 而 成 。 如 果 我 们 用 变量 expr 来 表示 表达 式 , 用 变量 stm 表示 语句 , 那么 这 个 构造 规则 可 以 表 
示 为 
stmt— if ( expr ) stmt else stmt 

其 中 的 箭头 (_) 可 以 读 作 “可 以 具有 如 下 形式 ”。 这 样 的 规则 称 为 产生 式 (produetion) 。 在 一 个 产 
汪 式 中 ， 像 关键 字 让 和 括号 这 样 的 词法 元 素 称 为 终结 符号 (terminal) 。 像 expr 和 stmt 这 样 的 变量 

终结 符号 的 序列 , 它们 称 为 非 终 结 符号 (nonterminal) 。 
2.2.1 文法 定义 

一 个 上 下 文 无 关 文 法 (context-free grammar) 由 四 个 元 素 组 成 : 

1) 一 个 终结 符号 集合 , 它们 有 时 也 称 为 “词法 单元 ”"。 终 结 符号 是 该 文法 所 定义 的 语言 的 基 
本 符号 的 集合 。 

2) 一 个 非 终结 符号 集合 Cian ee eee 每 个 非 终结 符号 表示 一 个 终结 符号 
串 的 集合 .我 们 将 在 后 面 介绍 这 种 表示 方法 。 

3) 一 不 产生 去 集合 ,其 中 每 个 产生 式 包括 一 个 称 为 产生 式 头 或 堪 部 的 非 终结 符号 ,一 个 稍 
半 ， 和 个 称 为 产生 式 体 或 右 部 的 由 终结 符号 及 非 终结 符号 组 成 的 序列 。 产生 式 主要 用 来 表示 
某 个 构造 的 某 种 书写 形式 。 如 果 产 生 式 头 非 终结 符 号 代表 一 个 构造 , 那么 该 产生 式 体 就 代表 了 
该 构造 的 一 种 书写 方式 。 

4) 指定 一 个 非 终结 符号 为 开始 符号 。 





词法 单元 和 终结 符号 

在 编译 器 中 , 词法 分 析 器 读 人 源 程序 中 的 字符 序列 , 将 它们 组 织 为 具有 词法 含义 的 词素 ， 
生成 并 输出 代表 这 些 词素 的 词法 单元 序列 。 词 法 单元 由 两 个 部 分 组 成 : 名 字 和 属性 值 。 词 法 
单元 的 名 字 是 语法 分 析 器 进行 语法 分 析 时 使 用 的 抽象 符号 。 我 们 常常 把 这 些 词法 单元 名 字 称 
为 终结 符号 , 因为 它们 在 描述 程序 设计 语言 的 文法 中 是 以 终结 符号 的 形式 出 现 的 。 如 果 词法 
单元 具有 属性 值 , 那么 这 个 值 就 是 一 个 指向 符号 表 的 指针 , 符号 表 中 包含 了 该 词法 单元 的 附 
加 信息 。 这 些 附 加 信息 不 是 文法 的 组 成 部 分 , 因此 在 我 们 讨论 语法 分 析 时 , 通常 将 词法 单元 
和 终结 符号 当做 同义词 。 











在 描述 文法 的 时 候 , 我 们 会 列 出 该 文法 的 产生 式 , 并 且 首 先 列 出 开始 符号 对 应 的 产生 式 。 我 

们 假设 数位 、 符号 (如 < 、<= ) 和 黑体 字符 种 ( 如 while) 都 是 终结 符号 。 斜 体 字 符 串 表示 非 终结 

符号 , 所 有 非 斜 体 的 名 字 或 符号 都 可 以 看 作 是 终结 符号 8。 为 表示 方便 , 以 同一 个 非 终结 符号 为 

头 部 的 多 个 产生 式 的 体 可 以 放 在 一 起 表示 , 不 同体 之 间 用 符号 | ( 读 作 “或 ”) 分 隔 。 

在 本 章 中 , 有 多 个 例子 使 用 由 数位 和 + 、- 符号 组 成 的 表达 式 , 比如 9 -5 +2、,3 -1 或 
。 由 于 两 个 数位 之 间 必 须 出 现 + 或 -, 我 们 把 这 样 的 表达 式 称 为 “由 + 、- 号 分 隔 的 数位 序 





名 “单个 斜体 字母 在 第 4 章 中 详细 讨论 文法 时 另 有 它 用 。 例 如 , 我 们 将 使 用 X、Y 和 2 来 表示 终结 符号 或 非 终结 符号 。 
但 是 , 包含 两 个 或 两 个 以 上 字符 的 任何 斜体 名 字 仍 然 表示 一 个 非 终 结 符号 。 
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列 ”。 下 面 的 文法 描述 了 这 种 表达 式 的 语法 。 此 文法 的 产生 式 包括 : 


list—list + digit (215 

list—list — digit (2.2) 

list—digit (213) 

digu=0- ILAS LS TMI NS (2.4) 


以 非 终结 符号 list 为 头 部 的 三 个 产生 式 可 以 等 价 地 组 合 为 : 
list—list + digit | list — digit | digit 
根据 我 们 的 习惯 , 该 文法 的 终结 符号 包括 如 下 符号 : 
0 12°93 45 67.8 9 

该 文法 的 非 终结 符号 是 斜体 名 字 list 和 digit, AA list 的 产生 式 首先 被 列 出 , 所 以 我 们 知道 
list 是 此 文法 的 开始 符号 。 O 

如 果 某 个 非 终结 符号 是 某 个 产生 式 的 头 部 , 我 们 就 说 该 产生 式 是 该 非 终 结 符号 的 产生 式 。 
一 个 终结 符号 串 是 由 零 个 或 多 个 终结 符号 组 成 的 序列 。 零 个 终结 符号 组 成 的 串 称 为 空 串 (empty 
string) ， 记 为 e9 。 
2.2.2 推导 

根据 文法 推导 符号 串 时 , 我 们 首先 从 开始 符号 出 发 ,不 断 将 某 个 非 终结 符号 蔡 换 为 该 非 终结 
符号 的 某 个 产生 式 的 体 。 可 以 从 开始 符号 推导 得 到 的 所 有 终结 符号 串 的 集合 称 为 该 文法 定义 的 
语言 (language) 。 A 
由 例 2. 1 中 的 文法 定义 的 语言 是 由 加 减 号 分 隔 的 数位 列表 的 集合 。 非 终结 符号 digi 的 
10 个 产生 式 使 得 digit 可 以 表示 0、1、…、 9 中 的 任意 数位 。 根 据 产 生 式 (2.3), 单个 数位 本 身 就 
是 一 个 list。 产 生 式 (2. 1) 和 (2.2) 表 达 了 如 下 规则 : 任何 列表 后 跟 一 个 符号 + 或 -以 及 男 一 个 数 
位 可 以 构成 一 个 新 的 列表 。 

产生 式 (2.1) ~ (2.4) 就 是 我 们 定义 所 期 望 的 语言 时 需要 的 全 部 产生 式 。 例 如 , 我 们 可 以 按 
照 如 下 方法 推导 出 9 -5 +2 是 一 个 list。 

1) 因为 9 是 digit ,根据 产生 式 (2.3) 可 知 9 是 listo 

2) 因为 5 是 digit, 且 9 Æ list, 由 产生 式 (2.2) 可 知 9 -5 也 是 listo 

3) 因为 2 是 digit, 9 -5 Æ list, 由 产生 式 (2.1) 可 知 , 9 -5 +2 也 是 list。 E 
UPR ” 另 一 种 稍 有 不 同 的 列表 是 函数 调用 中 的 参数 列表 。 在 Java 中 , 参数 是 包含 在 括号 中 
的 , 例如 max(x, y) 表 示 使 用 参数 x 和 y 调用 函数 max。 这 种 列表 的 一 个 微妙 之 处 是 终结 符 
号 “(” 和 “)” 之 间 的 参数 列表 可 能 是 空 串 。 我 们 可 以 为 这 样 的 序列 构造 出 具有 如 下 产生 式 的 
文法 


call —> id ( optparams ) 
optparams — params | e€ 
params —> params , param | param 


注意 , 在 opiparams(“ 可 选 参 数列 表 ”) 的 产生 式 中 , 第 二 个 可 选 规 则 体 是 6, 它 表示 空 的 符 
号 串 。 也 就 是 说 , optparams 可 以 被 替换 为 空 串 ， 因 此 一 个 cal 可 以 是 函数 名 加 上 两 个 终结 符号 
“(RIS)” BRAS R, WER, params 的 产生 式 和 例 2. 1 中 list 的 产生 式 类 似 , 只 是 将 算术 运 
算 符 + 或 - 换 成 了 逗号 , 并 将 digit 换 成 param。 函 数 参 数 实际 上 可 以 是 任意 表达 式 , 但 是 在 这 里 


O 从 技术 上 讲 , e 可 以 是 任意 字母 表 ( 符 号 的 集合 ) 上 的 零 个 符号 组 成 的 串 。 


- 
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我 们 没有 给 出 param 的 产生 式 。 稍 后 我 们 就 会 讨论 用 于 描述 不 同 的 语言 构造 ( 比如 表达 式 、 语 名 
等 ) 的 产生 式 。 oO 
语法 分 析 (parsing) 的 任务 是 : 接受 一 个 终结 符号 串 作为 输入 , 找 出 从 文法 的 开始 符号 推导 出 
这 个 串 的 方法 。 如 果 不 能 从 文法 的 开始 符号 推导 得 到 该 终结 符号 串 , 则 报告 该 终结 符号 串 中 包 
含 的 语法 错误 。 语 法 分 析 是 所 有 编译 过 程 中 最 基本 的 问题 之 一 , 主要 的 语法 分 析 方 法 将 在 第 4 章 
中 讨论 。 在 本 章 中 , 为 简单 起 见 , 我 们 首先 处 理 像 9-5 +2 这 样 的 源 程序 , 其 中 的 每 个 字符 均 为 
一 个 终结 符号 。 一 般 情况 下 , 一 个 源 程序 中 会 包含 由 多 字符 组 成 的 词素 , 这 些 词素 由 词法 分 析 右 
组 成 词法 单元 , 而 词法 单元 的 第 一 个 分 量 就 是 被 语法 分 析 器 处 理 的 终结 符号 。 
2.2.3 语法 分 析 树 
语法 分 析 树 用 图 形 方式 展现 了 从 文法 的 开始 符号 推导 出 相应 语言 中 的 符号 串 的 过 程 。 如 果 
非 终结 符号 4 有 一 个 产生 式 AAY, 那么 在 语法 分 析 树 中 就 可 能 有 一 个 标号 为 4 的 内 部 结 点 ， 
该 结 点 有 三 个 子 结 点 , 从 左 向 右 的 标号 分 别 为 X、Y、2: 


A 
FN ic 
E y a 


正式 地 讲 , 给 定 一 个 上 下 文 无 关 文 法 , 该 文法 的 一 棵 语法 分 析 树 (parse tree) 是 具有 以 下 性 质 的 树 : 

1) 根 结 点 的 标号 为 文法 的 开始 符号 。 

2) 每 个 叶子 结 点 的 标号 为 一 个 终结 符号 或 e。 

3) 每 个 内 部 结 点 的 标号 为 一 个 非 终结 符号 。 

4) 如 果 非 终结 符号 4 是 某 个 内 部 结 点 的 标号 , 并 且 它 的 子 结 点 的 标号 从 左 至 右 分 别 为 X, 
Xas +, Xn, 那么 必然 存在 产生 式 AXA Xn HX), XQ, +, Xn 既 可 以 是 终结 符号 , 也 可 
以 是 非 终结 符号 。 作 为 一 个 特殊 情况 , 如 果 4 一 e 是 一 个 产生 式 , 那么 一 个 标号 为 4 的 结 点 可 以 
只 有 一 个 标号 为 e 的 子 结 点 。 











关于 树 型 结构 的 术语 

树 型 数据 结构 在 编译 系统 中 起 着 重要 的 作用 。 

。 一 棵 树 由 一 个 或 多 个 结 点 (node) 组 成 。 结 点 可 以 带 有 标号 (label) , 在 本 书 中 标号 通常 
是 文法 符号 。 当 我 们 画 一 棵 树 时 ,我 们 常常 只 用 这 些 标号 来 代表 相应 的 结 点 。 

e 树 有 且 只 有 一 个 根 (root) 结 点 。 每 个 非 根 结 点 都 有 唯一 的 父 (parent ) 结 点 ; 根 结 点 没 
有 父 结 点 。 当 我 们 画 树 的 时 候 , 将 一 个 结 点 的 父 结 点 画 在 它 的 上 方 , HER 
之 间 画 一 条 边 。 因 此 根 结 点 是 最 高 的 (顶层 的 ) 结 点 。 

o 如 果 结 点 入 是 结 点 W 的 父 结 点 , 那么 族 就 是 入 的 子 (child) 结 点 。 一 个 结 点 的 各 个 子 
结 点 彼此 称 为 兄弟 (sibling) 结 点 。 它 们 之 间 是 有 序 的 ， He SRR Oe 在 
我 们 画 一 棵 树 时 也 遵循 这 个 顺序 排列 给 定 结 点 的 子 结 点 。 

e 没有 子 结 点 的 结 点 称 为 叶子 (leaf) 结 点 。 其 他 结 点 , 即 有 一 个 或 多 个 子 结 点 的 结 点 ， 称 
为 内 部 结 点 (interior node) o 

o 结 点 N 的 后 代 (descendant ) 结 点 要 么 是 结 点 .W 本 身 ， 要 人 么 是 .V 的 子 结 点 , 要 么 是 入 的 
子 结 点 的 子 结 点 , 依 此 类 推 ( 可 以 为 任意 层次 )。 如 果 结 点 M 是 结 点 V 的 后 代 结 点 , 那 
么 结 点 NN 是 结 点 M 的 祖先 (ancestor) 结 点 。 














abd 


例 2.2 中 9 -5 +2 的 推导 可 以 用 图 2-5 中 的 树 来 演示 。 树 中 每 个 结 点 的 标号 都 是 一 个 
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文法 符号 。 每 个 内 部 结 点 和 它 的 子 结 点 都 对 应 于 一 个 产生 式 。 其 中 , 内 部 结 点 对 应 于 产生 式 的 
K, 它 的 子 结 点 对 应 于 产生 式 的 体 。 

在 图 2-5 中 ; 根 结 点 的 标号 为 ix, 即 例 2.1 中 文法 的 开始 符号 。 根 结 点 的 子 结 点 的 标号 从 左 
向 右 分 别 为 list、+ 和 digit, WER: 

list—list + digit 

是 例 2. 1 中 文法 的 产生 式 。 根 结 点 的 左 子 结 点 和 根 结 点 类 似 , 只 list 
是 它 的 中 间 子 结 点 的 标号 为 - 而 不 是 +。 三 个 标号 为 digit 的 结 
SH, 每 个 结 点 都 有 一 个 以 具体 数位 为 标号 的 子 结 点 。 Do ely pm 

一 棵 语法 分 析 树 的 叶子 结 点 从 左 向 右 构成 了 树 的 结果 aie 
(yield) , 也 就 是 从 这 棵 语法 分 析 树 的 根 结 点 上 的 非 终结 符号 推导 digit 
得 到 (或 者 说 生成 ) 的 符号 串 。 在 图 2-5 中 的 结果 是 9 -5 +2。 为 1 gp 3 
了 方便 起 见 , 我 们 将 所 有 叶子 结 点 都 放 在 底层 。 以 后 我 们 不 一 定 r: 
会 把 叶子 结 点 按照 这 种 方法 排列 。 任 何 树 的 叶子 结 点 都 有 一 个 “oo 
自然 的 从 左 到 右 的 顺序 。 这 个 顺序 基于 如 下 思想 : OR X AY 
是 同一 个 父 结 点 的 子 结 点 , 并 且 X 在 了 的 左边 , 那么 X 的 所 有 后 代 结 点 都 在 Y 的 所 有 后 代 结 
点 的 左边 。 

一 个 文法 的 语言 的 另 一 个 定义 是 指 任何 能 够 由 某 棵 语法 分 析 树 生成 的 符号 串 的 集合 。 为 一 
个 给 定 的 终结 符号 串 构建 一 棵 语法 分 析 树 的 过 程 称 为 对 该 符号 串 进 行 语法 分 析 。 
2.2.4 ZNIE 

在 根据 一 个 文法 讨论 某 个 符号 串 的 结构 时 , 我 们 必须 非常 小 心 。 一 个 文法 可 能 有 多 棵 语法 
分 析 树 能 够 生成 同一 个 给 定 的 终结 符号 第。 这 样 的 文法 称 为 具有 二 义 性 (ambiguous) 。 要 证 明 一 
个 文法 具有 二 义 性 , 我 们 只 需要 找到 一 个 终结 符号 串 ， 说 明 它 是 两 棵 以 上 语法 分 析 树 的 结果 。 因 
为 具有 两 棵 以 上 语法 分 析 树 的 符号 串通 常 具有 多 个 含义 , 所 以 我 们 需要 为 编译 应 用 设计 出 没有 
二 义 性 的 文法 , 或 者 在 使 用 二 义 性 文法 时 使 用 附加 的 规则 来 消除 二 义 性 。 
DEE 假如 我 们 使 用 一 个 非 终 结 符号 sring, 并 且 不 像 例 2. 1 中 那样 区 分 数位 和 列表 , 我 们 可 
以 将 例 2. 1 中 的 文法 改写 如 下 : 

string—string + string | string — string |0 |1 |2 13 14 15 16 17 18 19 


list digit 


将 符号 digit 和 list 合并 为 非 终 结 符号 string ae 
是 有 一 些 意义 的 ， AA at ase 是 的 一 个 ae ; wives ei , oe 
特例 。 yah Ge, | | 2 

但 是 , 图 2-6 说 明 , 在 使 用 这 个 文法 时 ， 像 we = rg? i 
9-5 +2 这 样 的 表达 式 会 有 多 棵 语法 分 析 树 。 图 9 5 5 7 


中 9 -5 +2 的 两 棵 语法 分 析 树 对 应 于 两 种 带 括号 图 2-6 9 -5+2 的 两 棵 语法 分 析 树 
的 表达 式 : (9 -5) +2 和 9 - (5 +2)。 第 二 种 方 
法 给 出 的 表达 式 值 是 意 想不到 的 2, 而 不 是 通常 的 值 6。 例 2.1 的 语法 不 支持 这 样 的 解释 。 回 
2.2.5 运算 符 的 结合 性 

依照 惯例 , 9 +5 +2 等 价 于 (9 +5) +2, 9 -5 -2 等 价 于 (9 -5) -2, 当 二 个 运算 分 量 。 
(比如 上 式 中 的 5) 的 左右 两 侧 都 有 运算 符 时 , 我 们 需要 一 些 规则 来 决定 哪个 运算 符 被 应 用 于 该 
运算 分 量 。 我 们 说 运算 符 “+ ”是 左 结合 (associate) 的 ， 因 为 当 一 个 运算 分 量 左右 两 侧 都 有 “ + ” 
号 时 , 它 属于 其 左边 的 运算 符 。 在 大 多 数 程序 设计 语言 中 , I. 减 、 乘 、 除 四 种 算术 运算 符 都 是 
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左 结合 的 。 
某 些 常用 运算 符 是 右 结合 的 ,比如 指数 运算 。 作 为 男 一 个 例子 , C 语言 中 的 赋值 运算 符 ”=” 
及 其 后 毅 ( 即 += 、-= 等 一 译 者 注 ) 也 是 右 结合 的 。 也 就 是 说 , 对 表达 式 a =b = c 的 处 理 和 对 


表达 式 a = (b =c) 的 处 理 相 同 。 list right 
AA Bi 38 AE ES e 3 比如 a : a . fetter Í a 
可 以 由 如 下 文法 产生 : ; ETENE | | 
: list = digit 2 a. letter = right 
right — letter= right | letter | | | | 
letter + alb|---|z digit 5 b letter 
图 27 比较 了 一 个 左 结合 运算 符 ( 比 如 g 
“-”) 的 语法 分 析 树 和 一 个 右 结 合 运 算 符 ( 比 图 2-7 左 结合 运算 符 文 法 和 右 结合 
如 * =”) 的 语法 分 析 树 。 注 意 , 9 -5 - 2 的 语 by 


法 分 析 树 向 左下 端 延伸 , 而 a =b = c 的 语法 分 析 树 则 向 右 下 端 延伸 。 
2.2.6 运算 符 的 优先 级 

考虑 表达 式 9 +5 * 2 。 该 表达 式 有 两 种 可 能 的 解释 , 即 (9 +5)*2 或 9+(5*2)。+ 和 * 
的 结合 性 规则 只 能 作用 于 同一 运算 符 的 多 次 出 现 , 因此 它们 无 法 解决 这 个 二 义 性 。 为 此 ， 当 多 种 
运算 符 出 现时 , 我 们 需要 给 出 一 些 规 则 来 定义 运算 符 之 间 的 相对 优先 关系 。 

如 果 * 先 于 + 获得 运算 分 量 , 我 们 就 说 * 比 + 具有 更 高 的 优先 级 。 在 通常 的 算术 中 , 乘法 和 
除法 比 加 法 和 减法 具有 更 高 的 优先 级 。 因 此 在 表达 式 9 +5 *2 和 9 *5 +2 中 , 都 是 运算 分 量 5 
首先 参与 * 运算 ， 即 这 两 个 表达 式 分 别 等 价 于 9 + (5*2) 和 (9*5) +2。 
算术 表达 式 的 文法 可 以 根据 表示 运算 符 结合 性 和 优先 级 的 表格 来 构建 。 我 们 首先 考虑 
四 个 常用 的 算术 运算 符 和 一 个 优先 级 表 。 在 此 优先 级 表 中 , 运算 符 按照 优先 级 递增 的 顺序 排列 ， 
同一 行 上 的 运算 符 具 有 相同 的 结合 性 和 优先 级 : 

RAG: + - 
左 结合 : * / 

我 们 创建 两 个 非 终结 符号 expr 和 term, 分 别 对 应 于 这 两 个 优先 级 层次 , 并 使 用 另 一 个 非 终结 
符号 factor 来 生成 表达 式 中 的 基本 单元 。 当 前 , 表达 式 的 基本 单元 是 数位 和 带 括号 的 表达 式 。 

factor 一 digit | (expr) 

现在 我 们 考虑 具有 最 高 优先 级 的 二 目 运 算 符 * 和 /。 由 于 这 些 运算 符 是 左 结 合 的 , 因此 其 产 
生 式 和 左 结合 列表 的 产生 式 类 似 : 

term — term * factor 
| term / factor 
| factor 
类 似 地 , expr 生成 由 加 减 运算 符 分 隔 的 term 列表 : 
expr — expr + term 
| expr — term 
| term 
因此 最 终 得 到 的 文法 是 : 
expr — expr + term | expr —term | term 
term — term * factor | term / factor | factor 


factor — digit | (expr) 
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例 2.6 中 表达 式 文法 的 推广 

我 们 可 以 将 因子 (factor) 理解 成 不 能 被 任何 运算 符 分 开 的 表达 式 。“ 不 能 分 开 ” 的 意思 是 
说 当 我 们 在 任意 因子 的 任意 一 边 放 置 一 个 运算 符 ， 都 不 会 导致 这 个 因子 的 任何 部 分 分 离 出 
来 , 成 为 这 个 运算 符 的 运算 分 量 。 当 然 , 因子 本 身 作为 一 个 整体 可 以 成 为 该 运算 符 的 一 个 运 
算 分 量 。 如 果 这 个 因子 是 一 个 由 括号 括 起 来 的 表达 式 , 那么 括号 将 起 到 保护 其 不 被 分 开 的 作 
用 。 如 果 因 子 就 是 一 个 运算 分 量 , 那么 它 当 然 不 能 被 分 开 。 

一 个 (不 是 因子 的 ) 项 (term) 是 一 个 可 能 被 高 优先 级 的 运算 符 * 和 /分 开 , 但 不 能 被 低 优 
先 级 运算 符 分 开 的 表达 式 。 一 个 (不 是 因子 也 不 是 项 的 ) 表 达 式 可 能 被 任何 一 个 运算 符 分 开 。 

我 们 可 以 把 这 种 思想 推广 到 具有 任意 层 优先 级 的 情况 。 我 们 需要 n +1 个 非 终结 符号 。 
首先 , 例 2.6 中 描述 的 factor 不 可 被 分 开 。 通 常 , 这 个 非 终结 符号 的 产生 式 体 只 能 是 单个 运算 
分 量 或 括号 括 起 来 的 表达 式 。 然 后 , 对 于 每 个 优先 级 都 有 一 个 非 终结 符 , 表示 能 被 该 优先 级 
或 更 高 优先 级 的 运算 符 分 开 的 表达 式 。 通 常 , 这 个 非 终结 符 的 产生 式 有 一 些 产 生 式 体 表示 了 
该 优先 级 的 运算 符 的 应 用 ; 另 有 一 个 产生 式 体 只 包含 了 代表 更 高 一 层 优先 级 的 非 终结 符号 。 











使 用 这 个 文法 时 ， 一 个 表达 式 就 是 一 个 由 + 或 - 分 隔 开 的 项 (term) 的 列表 , 而 项 是 由 * 或 / 
分 隔 的 因子 (factor) 的 列表 。 请 注意 , 任何 由 括号 括 起 来 的 表达 式 都 是 一 个 因子 。 因 此 , 我 们 可 
以 使 用 括号 来 构造 出 具有 任意 嵌 套 深度 的 表达 式 (以 及 具有 任意 深度 的 语法 分 析 树 ) 。 o 
DH (pes eto eee ao ee ie ee eA ea 
别 语句 。 这 一 规则 的 例外 情况 包括 赋值 语句 和 过 程 调用 语句 。 由 图 2-8 中 的 (二 义 性 ) 文 法 定义 
的 语句 都 符合 Java 的 语法 。 

在 simi 的 第 一 个 产生 式 中 , 终结 符号 id 表示 任意 标识 符 。 非 终结 符号 expression 的 产生 式 还 
没有 给 出 。 第 一 个 产生 式 描述 的 赋值 语句 符合 Java 的 语法 ， 虽 然 Java 将 = 号 看 作 是 可 出 现在 表 
达 式 内 部 的 赋值 运算 符 。 比 如 , 在 Java 中 允许 出 现 


id = expression ; 


a=b=c, 而 这 个 文法 不 允许 出 现 这 样 的 形式 。 if ( expression ) stmt 
非 终结 符号 stmts 产生 一 个 可 能 为 空 的 语句 列表 。 if ( expression ) stmt else stmt 
> = a while ( expression ) stmt 
stmts 的 第 二 个 产生 式 生 成 一 个 空 列表 eo 第 一 个 产生 式 do stmt while ( expression ) ; 


生成 的 是 一 个 可 能 为 空 的 列表 再 跟 上 一 个 语句 。 人 

分 号 的 放置 方式 很 微妙 。 它 们 出 现在 所 有 不 以 stmt stmts stmt 
结尾 的 产生 式 的 未 尾 。 这 种 方法 可 以 避免 在 站 或 while 
这 样 的 语句 后 面 出 现 多 余 的 分 号 ， 因为 让 和 while 语句 图 2-8 Java 语句 的 子 集 的 文法 
的 最 后 是 一 个 骨 套 的 子 语句 。 当 嵌 套 子 语 句 是 一 个 赋 
值 语句 或 do-while 语句 时 , 分 号 将 作为 这 个 子 语句 的 一 部 分 被 生成 。 oO 
2.2.7 2.2 节 的 练习 

练习 2. 2. 1: 考虑 下 面 的 上 下 文 无 关 文 法 : 

5 Sans SES Sie li a 

1) 试 说 明 如 何 使 用 该 文法 生成 串 aa +a" 。 

2) 试 为 这 个 串 构 造 一 棵 语法 分 析 树 。 

3) 该 文法 生成 的 语言 是 什么 ? 证 明 你 的 答案 。 

练习 2. 2.2: 下 面 的 各 个 文法 生成 什么 语言 ? 证 明 你 的 每 二 个 答案 。 

1) S30"S 14.0.1 
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2) S> SS ie 

3)S—3+S(S)Sle 

4)S—aSbS|bSaSle 

Sy sal S + S/S 515 # 18) 

练习 2.2.3: AY 2.2.2 中 哪些 文法 具有 二 义 性 ? 

练习 2. 2.4: 为 下 面 的 各 个 语言 构建 无 二 义 性 的 上 下 文 无 关 文法 。 证 明 你 的 文法 都 是 正 
确 的 。 

1) 用 后 级 方式 表示 的 算术 表达 式 。 

2) 由 逗号 分 隔 开 的 左 结合 的 标识 符 列表 。 

3) 由 逗号 分 隔 开 的 右 结合 的 标识 符 列 表 。 

4) 由 整数 、 标 识 符 、 四 个 二 目 运算 符 + 、- 、* 、/ 构 成 的 算术 表达 式 。 

1 5) 在 4) 的 运算 符 中 增加 单 目 + 和 单 目 -构成 的 算术 表达 式 。 

#5) 2.2.5: 

1) 证 明 : 用 下 面 文法 生成 的 所 有 二 进 制 串 的 值 都 能 被 3 整除 。( 提 示 : 对 语法 分 析 树 的 结 点 
数目 使 用 数学 归纳 法 。) 

num — 11 | 1001 | num 0 | num num 
2) 上 面 的 文法 是 否 能 够 生成 所 有 能 被 3 整除 的 二 进 制 串 ? 
练习 2. 2. 6: 为 罗马 数字 构建 一 个 上 下 文 无 关 文 法 。 


2.3 语法 制导 翻译 


语法 制导 翻译 是 通过 向 一 个 文法 的 产生 式 附 加 一 些 规 则 或 程序 片段 而 得 到 的 。 比 如 , 考虑 

由 如 下 产生 式 生 成 的 表达 式 expr: 
expr sr expr) + term 

XE, expr 是 两 个 子 表达 式 expr, 和 term HAN. (expr, 中 的 下 标 仅仅 被 用 于 将 产生 式 体 中 ex- 
Pr 的 实例 和 产生 式 头 区 别 开 来 ) 。 我 们 可 以 利用 expr 的 结构 , 用 如 下 的 伪 代 码 来 翻译 expr: 

翻译 expr, ; 
翻译 term; 
处 理 +; 

我 们 将 在 2. 8 节 中 使 用 这 段 伪 代 码 的 二 个 变 体 , 为 expr 构造 一 棵 语法 分 析 树 : 我 们 首先 建立 
expr, 和 term 的 语法 分 析 树 ， 然 后 处 理 + 运算 符 并 构造 得 到 一 个 和 此 运算 符 对 应 的 结 点 。 为 方便 
起 见 , 本 节 中 的 例子 是 从 中 组 表达 式 到 后 级 表达 式 的 翻译 。 

本 节 介 绍 两 个 与 语法 制导 翻译 相关 的 概念 : 

o 属性 (attribute) : 属性 表示 与 菜 个 程序 构造 相关 的 任意 的 量 。 属 性 可 以 是 多 种 多 样 的 , 比 

如 表达 式 的 数据 类 型 、 生 成 的 代码 中 的 指令 数目 或 为 某 个 构造 生成 的 代码 中 第 一 条 指令 
的 位 置 等 等 都 是 属性 的 例子 。 因 为 我 们 用 文法 符号 (终结 符号 或 非 终结 符号 ) 来 表示 程序 
构造 , 所 以 我 们 将 属性 的 概念 从 程序 构造 扩展 到 表示 这 些 构造 的 文法 符号 上 。 

o (语法 制导 的 ) 翻 译 方案 (translation scheme) : 翻译 方案 是 一 种 将 程序 片段 附加 到 一 个 文法 

的 各 个 产生 式 上 的 表示 法 。 当 在 语法 分 析 过 程 中 使 用 一 个 产生 式 时 ,相应 的 程序 片段 就 
会 执行 。 这 些 程序 片段 的 执行 效果 按照 语法 分 析 过 程 的 顺序 组 合 起 来 , 得 到 的 结果 就 是 
这 次 分 析 / 综 合 过 程 处 理 源 程 序 得 到 的 翻译 结果 。 

语法 制导 的 翻译 方案 将 在 本 章 中 多 次 使 用 , 它 将 用 于 把 中 缀 表达 式 翻 译 成 后 级 表达 式 , 还 会 用 
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TRARRE, 并 用 来 构建 一 些 程序 构造 的 抽象 语法 树 。 第 5 章 将 更 详细 地 讨论 语法 制导 表示 法 。 
2.3.1 ”后缀 表示 

本 节 中 的 例子 处 理 的 是 中 缀 表达 式 到 其 后 缀 表示 的 翻译 。 一 个 表达 式 忆 的 后 组 表示 (postfix 
notation ) 可 以 按照 下 面 的 方式 进行 归纳 定义 : 

1) 如 果 五 是 一 个 变量 或 常量 , 则 的 后 缀 表示 是 本身 。 

2) WR E DÉU E op E, 的 表达 式 , 其 中 op 是 一 个 二 目 运算 符 , WA E KERETE 
E'iE',op, 这 里 E’; 和 五 > 分 别 是 E 和 E, 的 后 组 表示 。 

3) 如 果 五 是 一 个 形 如 (三 ) 的 被 括号 括 起 来 的 表达 式 ,， 则 互 的 后 级 表示 就 是 Ei 的 后 绥 
表示 。 
(9-5)+ 2 的 后 缀 表示 是 95- 2+ 。 也 就 是 说 ; 由 规则 工 可 知 ,9、5 和 2 的 翻译 结果 就 是 
这 些 常量 本 身 。 然 后 , 根据 规则 2, 9-5 的 翻译 结果 是 95- 。 由 规则 3 可 知 ， (9-5) 的 翻译 结果 
与 此 相同 。 翻 译 完 带 括号 的 子 表达 式 后 , 我 们 可 以 将 规则 2 应 用 于 整个 表达 式 ，(9- 5 ) 就 是 Ei, 
2H E,, 由 此 得 到 结果 95-2 +。 

再 举 男 外 一 个 例子 , 9- (5+ 2 ) 的 后 级 表达 式 是 952 +- 。 也 就 是 说 , 5 +2 首先 被 翻译 成 52 + 
然后 这 个 表达 式 又 成 为 减 号 的 第 二 个 运算 分 量 。 加 

运算 符 的 位 置 和 它 的 运算 分 量 个 数 (arity ) 使 得 后 级 表达 式 只 有 一 种 解码 方式 ， 所 以 在 后 绥 
表示 中 不 需要 括号 。 处 理 后 缀 表达 式 的 “技巧 ”就 是 从 左边 开始 不 断 扫描 后 级 串 ， 直到 发 现 一 个 
运算 符 为 止 。 然 后 向 左 找 出 适当 数目 的 运算 分 量 ， 并 将 这 个 运算 符 和 它 的 运算 分 量 组 合 在 一 起 。 
计算 出 这 个 运算 符 作用 于 这 些 运 算 分 量 上 后 得 到 的 结果 ， 并 用 这 个 结果 替换 原来 的 运算 分 量 和 
运算 符 。 然 后 继续 这 个 过 程 ,向 右 搜寻 另 一 个 运算 符 。 

RR 考虑 后 级 表达 式 952+ -3 * 。 从 左边 开始 扫描 ， 我 们 首先 遇 到 加 号 。 向 加 号 的 左边 看 ， 

我 们 找到 运算 分 量 5 和 7。 用 它们 的 和 7 替换 原来 的 52+ ,这 样 我 们 得 到 串 97- 3 * 。 现 在 最 大 
边 的 运算 符 是 减 号 , 它 的 运算 分 量 是 9 和 7。 将 这 些 符号 蔡 换 为 它们 的 差 , 得 到 23 * 。 最 后 , 将 
乘 号 应 用 在 2 和 3 E, 得 到 结果 6。 O 
2.3.2 综合 属性 

将 量 和 程序 构造 关联 起 来 ( 比如 把 数值 及 类 型 和 表达 式 相 关联 ) 的 想法 可 以 基于 文法 来 表示 。 
我 们 将 属性 和 文法 的 非 终结 符号 及 终结 符号 相关 联 。 然后 , 我 们 给 文法 的 各 个 产生 式 附 加 上 语 
义 规则 。 对 于 语法 分 析 树 中 的 一 个 结 点 ， 如 果 它 和 它 的 子 结 点 之 间 的 关系 符合 某 个 产生 式 , 那么 
该 产生 式 对 应 的 规则 就 描述 了 如 何 计算 这 个 结 点 上 的 属性 。 

语法 制导 定义 (syntax-directed definition) 把 中 每 个 文法 符号 和 一 个 属性 集合 相关 联 , 并 且 把 
@ 每 个 产生 式 和 一 组 语义 规则 (semantie rule) 相关 联 ,这 些 规则 用 于 计算 与 该 产生 式 中 符号 相关 
联 的 属性 值 。 

属性 可 以 按照 如 下 方式 求 值 。 对 于 一 个 给 定 的 输入 串 x, 构建 > 的 一 个 语法 分 析 树 。 然 后 按 
照 下 面 的 方法 应 用 语义 规则 来 计算 语法 分 析 树 中 各 个 结 点 的 属性 。 

假设 语法 分 析 树 的 一 个 结 点 NN 的 标号 为 文法 符号 了。 RMH X. a RRA AE X WAHE a 
的 值 。 如 果 一 棵 语法 分 析 树 的 各 个 结 点 上 标记 了 相应 的 属性 值 ， 那么 这 棵 语法 分 析 树 就 称 为 注 
# (annotated ) 语 法 分 析 树 (简称 注释 分 析 树 )。 比 如 , 图 2.9 显示 了 9_5 +42 的 一 棵 注释 分 析 树 ， 
其 中 属性 上 与 非 终结 符号 expr Fil term 关联 。 该 属性 在 根 结 点 处 的 值 为 95-2 +, 也 就 是 9-5 +2 的 
后 缀 表示。 我 们 很 快 会 看 到 这 些 表 达 式 的 计算 方法 。 

如 果 某 个 属性 在 语法 分 析 树 结 点 N 上 的 值 是 由 入 的 子 结 点 以 及 NN 本 身 的 属性 值 确定 的 , 那 
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么 这 个 属性 就 称 为 综合 属性 (synthesized attribute)。 综 合 属性 具有 一 个 很 好 的 性 质 : 只 需要 对 语法 


分 析 树 进行 一 次 自 底 向 上 的 遍历 , 就 可 以 计算 出 属 expr.t = 95=2# 

性 的 值 。 在 5.1.1 节 中 , 我 们 将 讨论 另外 一 种 重要 AT 5. 
的 属性 :“ 继 承 ” 属 性 。 非 正式 地 讲 , 继承 属性 在 某 ARE t A AEE 
个 语法 分 析 树 结 点 上 的 值 是 由 语法 分 析 树 中 该 结 点 。 jzprt 0 s a E 


本 身 、 父 结 点 以 及 兄弟 结 点 上 的 属性 值 决定 的 。 | | 
DEAD 图 2.9 中 的 注释 分 析 树 是 根据 图 2-10 
中 的 语法 制导 定义 得 到 的 。 该 语法 制导 定义 用 于 9 

把 一 个 表达 式 翻 译 成 为 该 表达 式 的 后 缀 形式 , 待 图 29 一 个 语法 分 析 树 的 各 个 结 点 上 的 属性 值 
翻译 的 表达 式 是 一 个 由 加 号 和 减 号 分 隔 的 数位 序 

列 。 图 中 每 个 非 终结 符号 有 一 个 值 为 字符 串 的 属性 与 它 表示 由 该 非 终 结 符号 生成 的 表达 式 的 后 
缀 表示 形式 。 语 义 规则 中 的 符号 || 表示 





字符 串 的 连接 运算 符 。 expr 一 expr, + term | expr.t = expr,.t || term.t || '+' 
一 个 数位 的 后 缀 形式 是 该 数位 本 身 。 expr —> expr, ~ term | expr.t = expr,.t || term.t || '-' 

例如 , 与 产生 式 term 一 9 相关 联 的 语义 expr 一 term expr.t = termt - 

规则 定义 如 下 : 当 该 产生 式 被 应 用 在 语法 | 2 1 ees ors 

分 析 树 的 某 个 结 点 上 时 ，term.t 的 值 就 是 





9 本身。 其 他 数位 也 按照 类 似 的 方法 进行 term > 9 termt = ' 
tapaa “ghey i BEM Petty Por fan tr cs 

产生 式 expr—expr, + term EF — PHA INS WARS. MIAH Ais HH ew 
pr, 给 出 ， 右 运算 分 量 由 term 给 出 。 与 这 个 产生 式 关联 的 语义 规则 

expr.t = expr;.t || term.t || + 

定义 了 计算 属性 expr. t 的 值 的 方式 , 它 将 分 别 代 表 左 右 运算 分 量 后 级 表示 形式 的 expri. t 和 term. t 
连接 起 来 , 再 在 后 面 加 上 加 号 , 就 得 到 了 属性 expr. t 的 值 。 这 个 规则 是 后 级 表达 式 定义 的 一 个 公 
式 化 表示 。 口 











区 分 一 个 非 终结 符号 的 不 同 使 用 的 规则 

在 规则 中 , 我 们 经 常 要 区 分 同一 个 非 终结 符号 在 一 个 产生 式 的 头 和 /或 体 中 的 多 次 使 用 ， 
在 例 2. 10 中 就 有 这 样 的 情况 。 原 因 是 在 语法 分 析 树 中 , 标号 为 同一 个 非 终 结 符号 的 不 同 结 点 
通常 在 翻译 中 具有 不 同 的 属性 值 。 我 们 将 采用 下 面 的 规则 : 出 现在 产生 式 头 中 的 非 终结 符号 
没有 下 标 ， 而 在 产生 式 体 中 的 非 终结 符号 带 有 不 同 的 下 标 。 同 一 个 非 终 结 符号 的 所 有 出 现 都 
按照 这 种 方式 区 分 , 并 且 下 标 不 是 名 字 的 组 成 部 分 。 然 而 , 读者 应 该 注意 使 用 了 这 种 下 标 约 
定 的 特定 翻译 规则 和 4 一 XX X, 这 样 表示 一 般 形 式 的 产生 式 的 区 别 。 在 后 者 中 , 带 下 标的 
XX 表示 任 意 文法 符号 的 列表 , 而 不 是 某 个 名 为 X 的 非 终 结 符号 的 不 同 实例 。 











O 在 这 个 规则 以 及 很 多 其 他 的 规则 中 ,同一 个 非 终结 符号 (这 里 是 expr) 会 在 一 个 产生 式 中 出 现 多 次 。 expri 中 的 下 
标 1 用 于 区 分 产生 式 中 expr 的 两 次 出 现 , 但 1” 并 不 是 该 非 终结 符号 的 一 部 分 。 在 下 面 的 “区 分 一 个 非 终结 符号 
的 不 同 使 用 的 约定 ”中 有 更 加 详细 的 描述 。 
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2.3.3 简单 语法 制导 定义 

例 2. 10 中 的 语法 制导 定义 具有 下 面 的 重要 性 质 ; 要 得 到 代表 产生 式 头 部 的 非 终结 符号 的 翻 
译 结果 的 字符 率 ， 只 需要 将 产生 式 体 中 各 非 终 结 符号 的 翻译 结果 按照 它们 在 非 终结 符号 中 的 出 
现 顺序 连接 起 来 , 并 在 其 中 穿插 一 些 附加 的 串 即 可 。 具 有 这 个 性 质 的 语法 制导 定义 称 为 简单 
(simple) 语 法 制导 定义 。 
考虑 图 2-10 中 的 第 一 个 产生 式 和 语义 规则 

产生 式 语义 规则 
expr —> expr, + term expr.t = expr;.t || term.t || '+' 

这 里 ,翻译 结果 expr. t 是 expr; K term 的 翻译 结果 的 连接 ， 再 跟 一 个 加 号 。 请 注意 ，expri 和 
ierm 在 产生 式 体 中 和 语义 规则 中 的 出 现 顺 序 是 相同 的 。 在 它们 的 翻译 结果 之 前 和 之 间 没 有 其 他 
符号 。 在 这 个 例子 中 , 唯一 的 附加 符号 出 现在 结尾 处 。 口 

当 讨论 翻译 方案 的 时 候 , 我 们 将 看 到 , 一 个 简单 语法 制导 定义 的 实现 很 简单 ,只 需要 按照 它 
们 在 定义 中 出 现 的 顺序 打印 出 附加 的 串 即 可 。 
2.3.4 树 的 遍历 

树 的 遍历 将 用 于 描述 属性 的 求 值 过 程 ,以 及 描述 一 个 翻译 方案 中 的 各 个 代码 片段 的 执行 过 
程 。 一 个 树 的 遍历 (traversal) 从 根 结 点 开始 , 并 按照 某 个 顺序 访问 树 的 各 个 结 点 。 

一 次 深度 优先 ( depth-first) 遍历 从 根 结 点 开始 , 递归 地 按照 任意 顺序 访问 各 个 结 点 的 子 结 点 ， 
并 不 一 定 要 按照 从 左 向 右 的 顺序 遍历 。 之 所 以 称 之 为 深度 优先 , 是 因为 这 种 遍历 总 是 尽 可 能 地 
访问 一 个 结 点 的 尚未 被 访问 的 子 结 点 , 因此 它 总 是 尽 可 能 快 地 访问 离 根 结 点 最 远 的 结 点 ( 即 最 深 
的 结 点 ) 。 

图 2-11 中 的 过 程 wsi( N) 就 是 一 个 深度 优先 遍 | PO E A NEEC) 1 
历 , 它 按照 从 左 向 右 的 顺序 访问 一 个 结 点 的 子 结 点 ， visit(C); 
如 图 2-12 所 示 。 在 这 个 遍历 中 , 完成 某 个 结 点 的 遍 FEAA eh 
历 之 前 (也 就 是 在 该 结 点 的 各 个 子 结 点 的 翻译 结果 | } 
都 计算 完毕 之 后 ) , 我 们 加 入 了 计算 每 个 结 点 的 翻 
译 结果 的 动作 。 一 般 来 说 , 我 们 可 以 任意 选 定 和 一 
次 遍历 过 程 相 关联 的 动作 ， 当 然 也 可 以 选择 什么 都 
不 做 。 

语法 制导 定义 没有 规定 一 棵 语法 分 析 树 中 各 个 
属性 值 的 求 值 顺 序 。 只 要 一 个 顺序 能 够 保证 计算 属 
性 a 的 值 时 , a 所 依赖 的 其 他 属性 都 已 经 计算 完毕 ， 
这 个 顺序 就 是 可 以 接受 的 。 综 合 属性 可 以 在 自 底 向 
上 沉 历 的 时 候 计算 。 自 顶 向 上 遍历 指 在 计算 完成 某 。 图 212 一 棵 树 的 深度 优先 遍历 的 例 了 
个 结 点 的 所 有 子 结 点 的 属性 值 之 后 才 计 算 该 结 点 的 属性 值 的 过 程 。 一 般 来 说 ,， 当 既 有 综合 属性 
又 有 继承 属性 时 , 关于 求 值 顺序 的 问题 就 变 得 相当 复杂 , 参见 5.2 节 。 
2.3.5 翻译 方案 

图 2-10 中 的 语法 制导 定义 将 字符 串 作 为 属性 值 附 加 在 语法 分 析 树 的 结 点 上 ,从 而 得 到 翻译 
结果 。 我 们 现在 来 考虑 另外 一 种 不 需要 操作 字符 串 的 方法 。 它 通过 运行 程序 片段 , 逐步 生成 相 
同 的 翻译 结果 。 


(CARD, 





图 2-11 一 棵 树 的 深度 优先 遍历 
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前 序 遍历 和 后 序 遍 历 

前 序 遍 历 和 后 序 遍 历 是 深度 优先 遍历 的 两 种 重要 的 特例 。 在 这 两 种 遍历 中 , 我 们 都 是 从 
堪 到 右 递归 地 访问 每 个 结 点 的 子 结 点 。 

RTZEN, 并 在 各 个 结 点 上 执行 某 些 特定 的 动作 。 如 果 动 作 在 我 们 第 一 次 访 
问 一 个 结 点 时 被 执行 , 那么 我 们 将 这 种 遍历 称 为 前 序 遍 历 ( preorder traversal ) 。 类 似 地 ， 如 
果 动 作 在 我 们 最 后 离开 一 个 结 点 前 被 执行 ， 则 称 这 种 遍历 为 后 序 遍 历 ( postorder traversal ) 。 
图 2-11 中 的 过 程 visit(N) 就 是 一 个 后 序 遍 历 的 例子 。 

前 序 遍 历 和 后 序 遍 历 根据 一 个 结 点 的 动作 执行 时 间 来 定义 这 些 结 点 的 相应 次 序 。 一 棵 以 
结 点 ,N 为 根 的 ( 子 ) 树 的 前 序 排 序 由 N; 跟 上 它 的 从 左 到 右 的 每 棵 子 树 ( 如 果 存 在 ) 的 前 序 排序 
组 成 。 而 二 棵 以 结 点 YY 为 根 的 ( 子 ) 树 的 后 序 排序 则 由 N 的 从 左 到 右 的 每 棵 子 树 的 后 序 排序 ， 
HREN 自身 组 成 。 











语法 制导 翻译 方案 和 语法 制导 定义 相似 ， 只 是 显 式 指定 了 语义 规则 的 计算 顺序 。 
被 嵌入 到 产生 式 体 中 的 程序 片段 称 为 语义 动作 (semantic action)。 一 个 语义 动作 用 花 括 号 括 
起 来 , 并 写 入 产生 式 的 体 中 , 它 的 执行 位 置 也 由 此 指定 ， 如 下 面 的 规则 所 示 : 
rest > + term | print( +") | rest; 

当 我 们 考虑 表达 式 的 另 一 种 形式 的 文法 时 , 我 们 就 会 看 到 这 样 的 规则 , 其 中 非 终结 符号 rest 
代表 “一 个 表达 式 中 除 第 一 个 项 之 外 的 一 切 ”。 这 种 形式 的 文法 将 在 2.4.5 节 中 讨论 。 此 外 ,， rest, 
中 的 下 标 将 非 终 结 符号 rest 在 产生 式 体 中 的 实例 与 产生 式 头 部 的 rest 实例 区 分 开 来 。 

当 我 们 画 出 一 个 翻译 方案 的 语法 分 析 树 时 , 我 们 为 每 个 语义 动作 构造 一 个 额外 的 子 结 点 ,并 


使 用 虚线 将 它 和 该 产生 式 头 部 对 应 的 结 点 相连 。 例 如 , 表示 上 a 
述 产生 式 和 语义 动作 的 部 分 语法 分 析 树 如 图 2-13 所 示 。 对 应 fos as 
于 语义 动作 的 结 点 没有 子 结 点 , 因此 在 第 一 次 访问 该 结 点 时 就 ene 
会 执行 这 个 动作 as 图 2-13 .为 一 个 语义 动作 创建 
DHA 62-4 的 语法 分 析 树 在 额外 的 叶子 结 点 中 含有 打 a AUEI TER 


印 语句 。 这 些 叶 子 结 点 通过 虚线 与 语法 分 析 树 的 内 部 结 点 相连 接 。 它 的 翻译 方案 如 图 2-15 所 示 。 
该 翻译 方案 的 基础 文法 生成 了 由 符号 + 和 - 分 隔 的 数位 序列 组 成 的 表达 式 。 假 设 我 们 对 整 棵 树 
进行 从 左 到 右 的 深度 优先 遍历 , 并 在 我 们 访问 它 的 叶子 结 点 时 执行 每 个 打印 语句 , 那么 产生 式 体 
中 内 由 的 语义 动作 将 把 这 样 的 表达 式 翻译 为 相应 的 后 级 表示 形式 。 


hae 


expr. {print (/+" )} 


ee 


expr - term parti! )} 2 {print('2')} 
term 5 {print('6’)} 
9... fprint('9")} 
图 2-14 489-5 +2 MEM 95-24 的 语义 动作 


图 2-14 的 根 结 点 代表 图 2-15 中 的 第 一 个 产生 式 。 这 个 根 结 点 的 最 左边 的 子 树 代表 左边 的 运 
算 分 量 , 它 的 标号 和 根 结 点 一 样 都 是 expr。 在 一 次 后 序 遍 历 中 , 我 们 首先 执行 该 子 树 中 的 所 有 语 
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义 动作 。 然 后 我 们 访问 没有 语义 动作 的 叶子 结 点 +。 接 下 来 , 我 们 执行 代表 右 运算 分 量 term 的 
子 树 中 的 所 有 语义 动作 。 最 后 执行 额外 结 点 上 的 语义 动作 


expr, + term {print(’+’)}- 





{print( ied) fo oh expr, = term  {print('-')} 
由 于 term 的 产生 式 的 右 部 只 有 一 个 数位 , 该 产 生 式 的 语 "| ; are 人 

义 动作 把 这 个 数位 打印 出 来 。 产 生 式 expr—term 不 需要 产生 {print(’1')} 

输出 ,只 有 前 面 两 个 产生 式 的 语义 动作 中 的 运算 符 才 会 打印 a {print('9!)} 

出 来 。 图 2-14 中 的 语义 动作 在 对 语法 分 析 树 的 后 序 遍 历 中 

执行 时 会 打印 出 95 -2+。 ER 图 2:15” 把 表达 式 翻 译 成 后 
注意 , 尽管 图 2-10 和 图 2-15 中 的 翻译 方案 产生 相同 的 缀 形式 的 语义 动作 


翻译 结果 , 但 它们 构造 结果 的 过 程 是 不 同 的 。 图 2-10 是 把 字符 串 作为 属性 附加 到 语法 分 析 树 中 
的 结 点 上 , 而 图 2-15 通过 语义 动作 把 翻译 结果 以 增 量 方式 打印 出 来 

如 图 2-14 所 示 的 语法 分 析 树 中 的 语义 动作 将 中 缀 表达 式 9 -=5+2 翻译 成 95 -2+; 它 恰好 
将 9 -5+2 中 的 每 个 字符 各 打印 一 次 。 它 不 需要 任何 附加 空间 来 存放 子 表达 式 的 翻译 结果 。 当 
按照 这 种 方式 递增 地 创建 输出 时 , 字符 的 打印 顺序 非常 重要 。 

实现 一 个 翻译 方案 时 , 必须 保证 各 个 语义 动作 按照 它们 在 语法 分 析 树 的 后 序 遍历 中 的 顺序 
执行 。 这 个 实现 不 一 定 要 真 的 构造 出 一 棵 语法 分 析 树 (通常 也 不 会 这 么 做 ) ， 只 要 能 够 确保 语义 
动作 的 执行 过 程 等 同 于 我 们 真 的 构建 了 语法 分 析 树 并 在 后 序 遍 历 中 执行 这 些 动 作 时 的 情形 。 
2.3.6 2.3 节 的 练习 

练习 2.3.1: 构建 一 个 语法 制导 翻译 方案 , 该 方案 把 算术 表达 式 从 中 级 表示 方式 翻译 成 运算 符 
在 运算 分 量 之 前 的 前 级 表示 方式 。 例 如 ，-xy 是 表达 式 x -y 的 前 缀 表示 法 。 给 出 输入 9-5+2 和 
9-5 #2 的 注释 分 析 树 5 

练习 2. 3. 2: 构建 一 个 语法 制导 翻译 方案 , 该 方案 将 算术 表达 式 从 后 缀 表示 方式 翻译 成 中 级 
表示 方式 。 给 出 输入 95 -2* 和 952*- 的 注释 分 析 树 。 

练习 2.3.3: 构建 一 个 将 整数 翻译 成 罗马 数字 的 语法 制导 翻译 方案 。 

练习 2.3.4; 构建 一 个 将 罗马 数字 翻译 成 整数 的 语法 制导 翻译 方案 。 

练习 2. 3. 5: 构建 一 个 将 后 级 算术 表达 式 翻 译 成 等 价 的 前 级 算术 表达 式 的 语法 制导 翻译 
方案 。 


2.4 语法 分 析 


语法 分 析 是 决定 如 何 使 用 一 个 文法 生成 一 个 终结 符号 串 的 过 程 。 在 讨论 这 个 问题 时 , 我 们 
可 以 想象 我 们 正在 构建 一 个 语法 分 析 树 , 这 样 可 以 帮助 我 们 理解 分 析 的 过 程 ; 尽管 在 实践 中 编译 
器 并 没有 真 的 构造 出 这 棵 树 。 然 而 ， et ald 否则 将 无 法 
保证 翻译 的 正确 性 。 

本 节 将 介绍 一 一 种 称 为 “递归 下 降 " 的 语法 分 析 方法 ， 该 方法 可 以 用 于 语法 分 析 和 实现 语法 制 
导 翻 译 器 。 下 一 节 将 给 出 一 个 实现 了 图 2-15 中 的 翻译 方案 的 完整 Java 程序 。 另 二 种 可 行 的 方法 
是 使 用 软件 工具 直接 根据 翻译 方案 生成 一 个 翻译 器 。4. 9 节 将 描述 一 个 这 样 的 工具 一 一 Yace。 使 
用 这 个 工具 , 无 需 修改 就 可 以 实现 图 2-15 中 的 翻译 方案 。 

对 于 任何 上 下 文 无 关 文法 , 我 们 都 可 以 构造 出 一 个 时 间 复 杂 度 为 O(n? ) 的 语法 分 析 器 , 它 最 
多 使 用 0(zw ) 的 时 间 就 可 以 完成 一 个 长 度 为 n 的 符号 串 的 语法 分 析 。 但 是 , 三 次 方 的 时 间 代 价 
一 般 来 说 太 昂贵 了 。 替 运 的 是 , 对 于 实际 的 程序 设计 语言 而 言 ,我们 通常 能 够 设计 出 一 个 可 以 被 
高 效 分 析 的 文法 。 线 性 时 间 复 杂 度 的 算法 足以 分 析 实 践 中 出 现 的 各 种 程序 设计 语言 ; 程序 设计 
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语言 的 语法 分 析 器 几乎 总 是 一 次 性 地 从 左 到 右 扫 描 输入 , 每 次 向 前 看 一 个 终结 符号 ,并 在 扫描 时 
构造 出 分 析 树 的 各 个 部 分 。 

大 多 数 语法 分 析 方 法 都 可 以 归 入 以 下 两 类 : 自 项 向 下 (top-down) 方 法 和 自 底 向 上 (bottom-up) 
方法 。 这 两 个 术语 指 的 是 语法 分 析 树 结 点 的 构造 顺序 。 在 自 顶 向 下 语法 分 析 器 中 ; 构造 过 程 从 
根 结 点 开始 , 逐步 向 叶子 结 点 方向 进行 ; 而 在 自 底 向 上 语法 分 析 器 中 , 构造 过 程 从 叶子 结 点 开 
始 , 逐步 构造 出 根 结 点 。 自 顶 向 下 语法 分 析 器 之 所 以 受 欢迎 , 是 因为 使 用 这 种 方法 可 以 较 容易 地 
手工 构造 出 高 效 的 语法 分 析 器 。 不 过 ， 自 底 向 上 分 析 方法 可 以 处 理 更 多 种 文法 和 翻译 方案 ,所 以 
直接 从 文法 生成 语法 分 析 器 的 软件 工具 常常 使 用 自 底 向 上 的 方法 。 

2.4.1 自 项 向 下 分 析 方法 

我 们 在 介绍 自 顶 向 下 的 分 析 方法 时 考虑 的 文法 适合 使 用 自 顶 向 下 分 析 技 术 。 在 本 节 后 面 的 
内 容 中 , 我 们 将 考虑 构造 自 顶 向 下 语法 分 析 器 的 一 般 方法 。 图 2-16 中 的 文法 生成 C Java 语句 
的 一 个 子 集 。 我 们 分 别 用 黑体 终结 符 证 和 for 
表示 关键 字 “if” 和 “for”, 以 强调 这 些 字 符 序 | 
列 被 视 为 一 个 单元 , 也 就 是 单个 终结 符号 。 此 P ARER E Pe ot Ee 
外 , 终结 符 expr 代表 表达 式 。 一 个 更 完整 的 文 





stmt. >. expr; 
if ( expr ) stmt 


gptezpr. 一 ”1 € 


法 将 使 用 非 终 结 符号 espr， 并 带 有 多 个 关于 非 | 
终结 符号 expr 的 产生 式 。 类 似 地 , other 是 一 个 
代表 其 他 语句 构造 的 终结 符号 。 

在 自 顶 向 下 地 构造 一 棵 如 图 2-17 所 示 的 语法 分 析 树 时 ,从 标号 为 开始 非 终结 符 simt 的 根 结 





图 2-16 C 和 Java 中 某 些 语句 的 文法 


点 开始 ,反复 执行 下 面 两 个 步 又 : 

1) 在 标号 为 非 终结 符号 4 的 结 点 NE, 选择 4 的 一 个 产生 式 , 并 为 该 产生 式 体 中 的 各 个 符 
号 构造 出 N 的 子 结 点 。 ‘dent 

2) 寻找 下 一 个 结 点 来 构造 子 树 , Be | SE 
择 的 是 语法 分 析 树 最 左边 的 尚未 扩展 的 非 终 “9” ed bai i 
结 符 2 € expr expr other 

对 于 某 些 文法 ， 上 面 的 步骤 只 需要 对 答 ee. 

入 串 进行 一 次 从 左 到 右 的 扫描 就 可 以 完成 。 图 217 根据 图 2-10 中 的 文法 得 到 的 语法 分 析 树 
输入 中 当前 被 扫描 的 终结 符号 通常 称 为 向 前 看 (lookahead ) 符号 。 在 开始 时 ,向 前 看 符号 是 输入 
串 的 第 一 个 ( 即 最 左 的 ) 终 结 符号 。 图 2-18 演示 了 构造 如 下 输入 串 的 语法 分 析 树 的 过 程 : 

for (; expr ; expr ) other 

得 到 的 语法 分 析 树 如 图 2-17 所 示 。 一 开始 , 向 前 看 符号 是 终结 符号 for, 语法 分 析 树 的 已 知 
部 分 只 包含 标号 为 开始 非 终结 符号 some 的 根 结 点 , 如 图 2.18a 所 示 。 我 们 的 目标 是 以 适当 的 方法 
构造 出 语法 分 析 树 的 其 余部 分 ,使 得 这 棵 树 生成 的 符号 串 与 输入 符号 捉 匹 配 。 

为 了 与 输入 串 匹 配 , 图 2.18a 中 的 非 终结 符号 stmt 必须 推导 出 一 个 以 向 前 看 符号 for 开头 的 
串 。 在 图 2-16 所 示 的 文法 中 ,stmi 只 有 一 个 产生 式 可 以 推导 出 这 样 的 第， 所 以 我 们 选择 这 个 产生 
式 , 并 构造 出 根 结 点 的 各 个 子 结 点 , 并 使 用 该 产生 式 体 中 的 符号 作为 这 些 子 结 点 的 标号 。 这 棵 语 
法 分 析 树 的 这 次 扩展 如 图 2-18b 所 示 。 

在 图 2-18 所 示 的 三 个 快照 中 ,都 包含 一 个 指向 输入 串 中 向 前 看 符号 的 箭头 和 -一 个 指向 当前 
正 被 考虑 的 语法 分 析 树 结 点 的 箭头 。 一 旦 一 个 结 点 的 子 结 点 全 部 构造 完毕 , 我 们 就 要 考虑 该 结 
点 的 最 左 子 结 点 。 在 图 2-185 中 , 根 结 点 的 子 结 点 刚刚 构造 完毕 ,下 一 个 要 考虑 的 结 点 是 标号 为 
for 的 最 左 子 结 点 。 
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图 2-18 ”从 左 到 右 扫描 输入 串 时 进行 的 自 顶 向 下 语法 分 析 


如 果 当 前 正 考虑 的 语法 分 析 树 结 点 的 标号 是 一 个 终结 符号 , 而 且 此 终结 符号 与 向 前 看 符号 
匹配 , 那么 语法 分 析 树 的 箭头 和 输入 的 箭头 都 前 进一步 。 输 入 中 的 下 一 个 终结 符 成 为 新 的 向 前 
看 符号 ， 同 时 考虑 语法 分 析 树 的 下 一 个 子 结 点 。 在 图 2-18e 中 , 语法 分 析 树 的 箭头 指向 根 的 下 一 
个 子 结 点 , 输入 中 的 箭头 已 经 前 进 到 下 一 个 终结 符号 , 即 “(”。 再 下 一 步 将 使 得 语法 分 析 树 的 箭 
头 指向 标号 为 非 终结 符 号 optexpr 的 子 结 点 , 并 将 输入 的 箭头 指向 终结 符号 “; ”。 

在 标号 为 optexpr 的 非 终结 符号 结 点 上 ,我 们 需要 再 次 为 一 个 非 终结 符号 选择 产生 式 。 以 * 
为 体 的 产生 式 ( 即 e 产 生 式 ) 需 要 特殊 处 理 。 当 前 ; 我 们 将 产生 式 当 作 默认 选择 ,只 有 在 没有 其 
他 产生 式 可 用 时 才 会 选择 它们 。 我 们 将 在 2. 4. 3 节 中 再 次 讨论 产生 式 。 对 于 非 终结 符号 optexpr 
和 向 前 看 符号 ^“; ”, 我 们 使 用 optexpr 的 e FER, 因为 “; ”和 optexpr 仅 有 的 另 一 个 产生 式 不 匹 
Be, 那个 产生 式 的 体 是 终结 符号 expr. 

一 般 来 说 , 为 一 个 非 终 结 符号 选择 产生 式 是 一 个 “尝试 并 犯错 ”的 过 程 。 也 就 是 说 , 我 们 首 
先 选择 一 个 产生 式 , 并 在 这 个 产生 式 不 合适 时 进行 回 滴 , 再 尝试 男 一 个 产生 式 。 一 个 产生 式 “ 不 
合适 ”是 指使 用 了 该 产生 式 之 后 , 我 们 无 法 构造 得 到 一 棵 与 当前 输入 串 相 匹配 的 语法 分 析 树 。 但 
是 在 称 为 预测 语法 分 析 的 特殊 情形 下 不 需要 进行 回 滴 。 我们 接 下 来 将 讨论 这 个 方法 。 

2.4.2 预测 分 析 法 

递归 下 降 分 析 方 法 (Tecursive-descent parsing ) 是 一 种 自 顶 向 下 的 语法 分 析 方 法 ， 它 使 用 一 组 
递归 过 程 来 处 理 输 入 。 文法 的 每 个 非 终结 符 都 有 一 个 相关 联 的 过 程 。 这 里 我 们 考虑 递归 下 降 分 
析 法 的 一 种 简单 形式 , 称 为 预测 分 析 法 (predictive parsing) 。 在 预测 分 析 法 中 , 各 个 非 终结 符号 对 
应 的 过 程 中 的 控制 流 可 以 由 向 前 看 符号 无 二 义 地 确定 。 在 分 析 输 入 串 时 出 现 的 过 程 调用 序列 隐 
式 地 定义 了 该 输入 串 的 一 棵 语法 分 析 树 。 如 果 需 要 , 还 可 以 通过 这 些 过 程 调用 来 构建 一 个 显 式 
的 语法 分 析 树 。 
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2-19 的 预测 分 析 器 包含 了 两 个 过 程 stmt( ) 和 optexpr( )， 分 别 对 应 于 图 2-16 中 文法 的 非 终 
结 符号 stmt 和 optexpr。 该 分 析 器 还 包括 一 个 额外 的 过 程 match。 这 个 额外 过 程 用 来 简化 stmt 和 
optexpr 的 代码 。 过 程 match (1) BE MBAR ¢ 和 向 前 看 符号 比较 ,如 果 匹 配 就 前 进 到 下 一 个 输入 终结 
符号 。 因 此 , match 改变 了 全 局 变量 lookhead 的 值 , 该 变量 存储 了 当前 正 被 扫描 的 输入 终结 符号 。 


void stmt() { 

switch ( lookahead ) { 

case expr: 
match(expr); match(';'); break; 

case if: 
match(if); match('('); match(expr); match(')'); stmt(); 
break; 

case for: 
match(for); match(' C); 
optexpr(); match(';'); optexpr(); match(';'); optexpr(); 
match(')'); stmt(); break; 

case other; 
match(other); break; 

default: 
report("syntax error"); 

} 





} 


void optezpr() { 
if ( lookahead == expr ) match(expr); 





} 

void match(terminal t) { 
if ( lookahead == t ) lookahead = nextTerminal; 
else report("syntax error"); 

} 





图 2-19 一 个 预测 分 析 器 的 伪 代 码 


分 析 过 程 开始 时 , 首先 调用 文法 的 开始 非 终 结 符号 simt 对 应 的 过 程 。 在 处 理 如 图 2-18 所 示 
的 输入 时 ,lookhead 被 初始 化 为 第 一 个 终结 符号 for。 过 程 stmt 执行 和 如 下 产生 式 对 应 的 代码 : 
; stmt — for ( optexpr ; optexpr ; optexpr ) stmt 
在 对 应 于 该 产生 式 体 的 代码 中 一 一 即 图 2-19 的 过 程 stmt 中 处 理 for 语句 的 case 分 支 一 一 每 
个 终结 符 都 和 向 前 看 符号 匹配 ， 而 每 个 非 终结 符 都 产生 一 个 对 相应 过 程 的 调用 : 
match ( for ) 2 match ( A S $ 
optexpr( ) ; match('; '); optexpr( ); match('; '); optexpr() ; 
match(')’); stmt() ; 
预测 分 析 需 要 知道 哪些 符号 可 能 成 为 一 个 产生 式 体 所 生成 串 的 第 一 个 符号 。 更 精确 地 说 , S a 
是 一 个 文法 符号 (终结 符号 或 非 终结 符号 ) 串 。 我 们 将 FIRST(a) 定义 为 可 以 由 a 生成 的 一 个 或 多 
个 终结 符号 串 的 第 一 个 符号 的 集合 。 如 果 a 就 是 e 或 者 可 以 生成 e, 那么 e 也 在 FIRST(a) 中 。 
关于 计算 FIRST(a) 的 算法 的 详细 描述 将 在 4. 4. 2 节 中 给 出 。 这 里 , 我们 将 使 用 不 具 一 般 性 
的 推导 方法 来 求 出 FIRST(a) 中 的 符号 。 通 常情 况 下 , a 要 人 么 以 一 个 终结 符号 开头 ,此 时 该 终结 
符号 就 是 FIRST(a) 中 的 唯一 符号 ; BA a 以 一 个 非 终 结 符号 开头 , 且 该 非 终结 符 的 所 有 产生 式 
体 都 以 某 个 终结 符号 开头 ,那么 这 些 终结 符号 就 是 FIRST(a) 的 所 有 成 员 。 
例如 ,对 于 图 2-16 中 的 文法 , H FIRST 的 正确 计算 如 下 : 
FIRST(stmi) = |expr, if, for, other} 
FIRST(expr ; ) = {expr} 


一 个 简单 的 语法 制导 翻译 器 4] 





WA IATA Aa Al AB, 我 们 就 必须 考虑 相应 的 FIRST 集合 。 如 果 我 们 不 考虑 € 产 
ER, 预测 分 析 法 要 求 FIRST(a) 和 FIRST(B) 不 相交 , 那么 就 可 以 用 向 前 看 符号 来 确定 应 该 使 用 
哪个 产生 式 。 如 果 向 前 看 符号 在 FIRST(a) 中 , 就 使 用 ws 如 果 向 前 看 符号 在 FIRST(B6) 中 ,就 使 
H Bo 
2.4.3 何 时 使 用 e 产生 式 

我 们 的 预测 分 析 器 在 没有 其 他 产生 式 可 用 时 , 将 e 产 生 式 作为 默认 选择 使 用 。 处 理 图 2-18 
所 示 的 输入 时 , 在 终结 符号 for 和 “( ”匹配 之 后 ;向 前 看 符号 为 “; ”。 此 时 ,过 程 optexpr 被 调用 ， 
其 过 程 体 中 的 代码 : 

if ( lookahead == expr ) match( expr) ; 
被 执行 。 非 终结 符号 optexpr 有 两 个 产生 式 , 它们 的 体 分 别 是 expr 和 se。 向 前 看 符号 ;“ 与 终结 
符号 expr 不 匹配 , 因此 不 能 使 用 以 expr 为 体 的 产生 式 。 事 实 上 ， 该 过 程 没有 改变 向 前 看 符号 ， 
也 没有 做 任何 其 他 操作 就 返回 了 。 不 做 任何 操作 就 对 应 于 应 用 e 产生 式 的 情形 。 

对 于 更 加 一 般 化 的 情况 , 我 们 考虑 图 2-16 中 产生 式 的 一 个 变 体 , 其 中 optexpr 生成 一 个 表达 
式 非 终结 符号 ， 而 不 是 终结 符号 expr: 

optexpr 一 > expr 
| e€ 

这 样 ，optexpr 要 么 使 用 非 终 结 符号 expr 生成 一 个 表达 式 , BAA Meo 在 对 optexpr 进行 语法 
分 析 时 ， 如 果 向 前 看 符号 不 在 FIRST (expr), 我 们 就 使 用 e 产生 式 。 

要 更 加 深入 地 了 解 应 该 在 何 时 使 用 e 产生 式 , 请 参见 4.4. 3 节 中 关于 LL(1) 文 法 的 讨论 。 
2.4.4 设计 一 个 预测 分 析 器 

我 们 可 以 将 2.4. 2 节 中 非 正式 介绍 的 技术 推广 应 用 到 任意 具有 如 下 性 质 的 文法 上 : 对 于 文法 
的 任何 非 终结 符号 ,， 它 的 各 个 产生 式 体 的 FIRST 集合 互 不 相交 。 我 们 还 将 看 到 ,如 果 我 们 有 一 个 
翻译 方案 , 即 一 个 增加 了 语义 动作 的 文法 , 那么 我 们 可 以 将 这 些 语 义 动 作 当 作 此 语法 分 析 器 的 过 
程 的 一 部 分 执行 。 

回顾 一 下 , 一 个 预测 分 析 器 (predictive parser) 程序 由 各 个 非 终结 符 对 应 的 过 程 组 成 。 对 应 于 
非 终结 符 4 的 过 程 完成 以 下 两 项 任务 : 

1) 检查 向 前 看 符号 , 决定 使 用 4 的 哪个 产生 式 。 如 果 一 个 产生 式 的 体 为 a( 这 里 a 不 是 空 串 
e) 且 向 前 看 符号 在 FIRST(a) 中, 那么 就 选择 这 个 产生 式 。 对 于 任何 向 前 看 符号 , 如 果 两 个 非 空 的 
产生 式 体 之 间 存在 冲突 , 我 们 就 不 能 对 这 种 文法 使 用 预测 语法 分 析 。 另 外 , WR A 有 产生 式 , 那 
么 只 有 当 向 前 看 符号 不 在 A 的 其 他 产生 式 体 的 FIRST 集合 中 时 , 才 会 使 用 4 的 e 产 生 式 。 

2) 然后 , 这 个 过 程 模拟 被 选中 产生 式 的 体 。 也 就 是 说 ,从 左边 开始 逐个 “执行 "此 产生 式 体 
中 的 符号 。“ 执 行 > 一 个 非 终结 符号 的 方法 是 调用 该 非 终结 符号 对 应 的 过 程 ,一 个 与 向 前 看 符号 
匹配 的 终结 符号 的 “执行 "方法 则 是 读 人 下 一 个 输入 符号 。 如 果 在 某 个 点 上 ;产生 式 体 中 的 终结 
符号 和 向 前 看 符号 不 匹配 , 那么 语法 分 析 器 就 会 报告 一 个 语法 错误 。 

图 2-19 显示 的 是 对 图 2-16 的 文法 应 用 这 些 规则 的 结果 。 

就 像 通过 扩展 文法 来 得 到 一 个 翻译 方案 一 样 , 我 们 也 可 以 扩展 一 个 预测 分 析 器 来 获得 一 个 
语法 制导 的 翻译 器 。 在 5. 4 节 中 将 给 出 一 个 能 够 达到 此 目的 的 算法 。 下 面 的 部 分 构造 方法 已 经 
可 以 满足 当前 的 要 求 : 

1) 先 不 考虑 产生 式 中 的 动作 , 构造 一 个 预测 分 析 器 。 

2) 将 翻译 方案 中 的 动作 拷贝 到 语法 分 析 器 中 。 如 果 一 个 动作 出 现在 产生 式 p 中 的 文法 符号 
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的 后 面 , 则 该 动作 就 被 拷贝 到 p 的 代码 中 外 的 实现 之 后 。 否则 ,如果 该 动作 出 现在 一 个 产生 式 
的 开头 ,那么 它 就 被 拷贝 到 该 产生 式 体 的 实现 代码 之 前 。 

我 们 将 在 2.5 节 构 造 这 样 一 个 翻译 器 。 
2.4.5 左 递归 

递归 下 降 语法 分 析 器 有 可 能 进入 无 限 循环 。 当 出 现 如 下 所 示 的 “ 左 递 归 ” 产 生 式 时 , 分 析 带 
就 会 出 现 无 限 循环 : 

expr —> expr + term 

在 这 里 , 产生 式 体 的 最 左边 的 符号 和 产生 式 头 部 的 非 终 结 符 相 同 。 假 设 expr 对 应 的 过 程 决定 使 
用 这 个 产生 式 。 因 为 产生 式 体 的 开头 是 expr, 所 以 expr 对 应 的 过 程 将 被 递归 调用 。 由 于 只 有 当 产 
生 式 体 中 的 一 个 终结 符号 被 成 功 匹配 时 ， 向 前 看 符号 才 会 发 生 改 变 ; 因此 在 对 expr 的 两 次 调用 之 
间 输 入 符号 没有 发 生 改变 。 结 果 , 第 二 次 expr 调用 所 做 的 事情 与 第 一 次 调用 所 做 的 完全 相同 , 这 
意味 着 会 对 expr 进行 第 三 次 调用 , 并 不 断 重复 , 进入 无 限 循环 。 

通过 改写 有 问题 的 产生 式 就 可 以 消除 左 递归 。 考 虑 有 两 个 产生 式 : 

A— Aa | B ive 
的 非 终结 符号 4, 其 中 a 和 有 是 不 以 4 开头 的 终结 符号 / 非 终 结 符号 的 
序列 。 例 如 , 在 产生 式 
expr —> expr + term | term W 

中 , 非 终结 符号 4 =expr, Hia= + term, B = termo T 

因为 产生 式 4 Ao 的 右 部 的 最 左 符号 是 4 自身 , 非 终结 符号 4 A 
和 它 的 产生 式 就 称 为 直 递 归 的 (left recursive) ©, FREMRI ER [ge |e] Ta 
将 在 4 的 右边 生成 一 个 a 的 序列 , 如 图 2-20a 所 示 。 当 4 最 终 被 替换 a) 
Wy Bit, 我 们 就 得 到 了 一 个 在 B 后 跟 有 0 个 或 多 个 a 的 序列 。 4 

如 图 2-20b 所 示 , 使 用 一 个 新 的 非 终 结 符号 R, 并 按照 如 下 方式 改 “a 
写 4 的 产生 式 可 以 达到 同样 的 效果 : i 

og T 
R—>aRle R 

非 终 结 符号 RR 和 它 的 产生 式 R 一 aR 是 右 递归 的 (right recursive ) , 
因为 这 个 产生 式 的 右 部 的 最 后 一 个 符号 就 是 及 本 身 。 如 图 2-20b 所 示 ， [ea[e[| Te| 
右 递归 的 产生 式 会 使 得 树 向 右 下 方向 生长 。 因 为 树 是 向 右 下 生长 的 , 对 
包含 了 左 结合 运算 符 ( 比如 减法 ) 的 表达 式 的 翻译 就 变 得 较为 困难 。 SR 图 2-20 生成 一 个 串 的 左 递 
而 , 我 们 将 在 2.5.2 节 看 到 , 通过 仔细 设计 翻译 方案 , 我 们 仍然 可 以 将 一 归 方 式 和 右 递归 方式 
个 表达 式 正确 地 翻译 成 后 级 表达 式 。 

在 43.3 节 , 我 们 将 考虑 更 一 般 的 左 递归 形式 , 并 说 明 如 何 从 文法 中 消除 左 递归 。 
2.4.6 2.4 节 的 练习 

练习 2. 4. 1: 为 下 列 文法 构造 递归 下 降 语 法 分 析 器 : 

Ds rssi- She 

2) S>S(S)Sle 

3) S>O0S1101 

















R 
| 
€ 








© 在 一 般 的 左 递归 文法 中 , 非 终 结 符号 A 可 能 通过 一 些 中 间 产 生 式 推导 出 Ao, 而 不 一 定 存在 产生 式 4 > Aas 
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2.5 简单 表达 式 的 翻译 器 


使 用 前 面 三 节 介 绍 的 技术 , 现在 我 们 可 以 用 Java 语言 编写 一 个 语法 制导 翻译 器 。 这 个 翻译 
器 可 以 把 算术 表达 式 翻 译 成 等 价 的 后 缀 形式 。 为 了 使 最 初 的 程序 比较 小 且 容 易 理解 , 我 们 首先 
处 理 最 简单 的 表达 式 , 即 由 二 目 运算 符 加 号 和 减 号 分 隔 的 数位 序列 。 在 2.6 节 中 , 我 们 将 扩展 这 
个 程序 , 使 它 能 够 翻译 包含 数字 和 其 他 运算 符 的 表达 式 。 由 于 表达 式 是 很 多 程序 设计 语言 中 的 
构造 , 因此 深入 研究 表达 式 的 翻译 问题 是 有 意义 的 。 


expr+term { print(‘+’) } 





语法 制导 翻译 方案 常常 作为 翻译 器 的 规约 。 图 2-21( 图 expr - term { print('~’) } |- 
2-15 的 重复 ) 中 的 翻译 方案 定义 了 将 要 执行 的 翻译 过 程 。 term. 

在 使 用 一 个 预测 语法 分 析 器 进行 语法 分 析 时 , 我 们 常 { print('0') } 
常 需要 修改 一 个 给 定 翻 译 方案 的 基础 文法 。 特别 地 ， -=n Uae 2) 
图 2-21 中 的 翻译 方案 的 文法 是 左 递归 的 。 如 上 节 所 述 , 预 { print('9') } 
测 语法 分 析 器 不 能 处 理 左 递归 的 文法 。 


现在 我 们 看 起 来 处 在 矛盾 之 中 : 一 方面 , 我 们 需要 一 图 2-21 翻译 为 后 级 表示 形式 的 动作 
个 能 够 支持 翻译 规约 的 文法 ; 另 一 方面 , 我 们 又 需要 一 个 明显 不 同 的 能 够 支持 语法 分 析 过 程 的 文 
法 。 解 决 的 方法 是 首先 使 用 易于 翻译 的 文法 ， 然 后 再 小 心地 对 这 个 文法 进行 转换 , 使 之 能 够 支持 
语法 分 析 。 通 过 消除 图 2221 中 的 左 递归 , 我 们 可 以 得 到 一 个 适用 于 预测 递归 下 降 翻译 器 的 文法 。 
2.5.1 抽象 语法 和 具体 语法 

设计 一 个 翻译 器 时 ,名 为 抽象 语法 树 (abstract syntax tree) 的 数据 结构 是 一 个 很 好 的 起 点 。 在 一 
个 表达 式 的 抽象 语法 树 中 , 每 个 内 部 结 点 代表 一 个 运算 符 , 该 结 点 的 子 结 点 代表 这 个 运算 符 的 运算 
分 量 。 对 于 更 加 一 般 化 的 情况 , 当 我 们 处 理 任意 的 程序 设计 语言 构造 时 ,我们 可 以 创建 一 个 针对 这 
个 构造 的 运算 符 , 并 把 这 个 构造 的 具有 语义 信息 的 组 成 部 分 作为 这 个 运算 符 的 运算 分 量 。 

9 -5 +2 的 抽象 语法 树 如 图 2.22 所 示 , 其 中 根 结 点 代表 运算 符 +， 根 结 点 的 子 树 分 别 代表 
子 表达 式 9 -5 和 2。 将 9 -5 组 成 一 个 运算 分 量 反 映 了 在 对 优先 级 相同 的 运算 符 求 值 时 , RE 
顺序 总 是 从 左 到 右 的 ;因为 + 和 -具有 相同 的 优先 级 , 因此 9 -5 +2 等 价 于 (9 -5) +2。 

抽象 语法 树 也 简称 语法 树 (syntax tree), 在 某 种 程度 上 和 语法 分 析 树 相似 。 但 是 在 抽象 语法 
树 中 , 内 部 结 点 代表 的 是 程序 构造 ; 而 在 语法 分 析 树 中 ,内 部 结 点 代表 的 是 非 终 结 符号 。 文 法 中 
的 很 多 非 终 结 符号 都 代表 程序 的 构造 , 但 也 有 一 部 分 是 各 种 各 样 的 辅助 符号 ,比如 那些 代表 项 、 
因子 或 其 他 表达 式 变 体 的 非 终结 符号 。 在 抽象 语法 树 中 , 通常 不 需要 这 些 辅助 符号 , 因此 会 将 这 
些 符号 省 略 掉 。 为 了 强调 它们 之 间 的 区 别 , 我们 有 时 把 语法 分 析 树 称 为 具体 语法 树 ( concrete syn- 
tax tree) ， 而 相应 的 文法 称 为 该 语言 的 具体 语法 (concrete syntax) 。 É 

在 图 2.22 给 出 的 语法 树 中 ,每 个 内 部 结 点 都 和 一 个 运算 符 关联 。 es 
树 中 没有 对 应 于 expr—term 这 样 的 单产 生 式 ( 即 产生 式 体 中 仅 包含 一 YORE 
个 非 终结 符号 的 产生 式 ) 的 “辅助 " 结 点 , 也 没有 对 应 于 e 产 生 式 (比如 i 
rest—e) WIZE o 图 2-22 9-5 +2 的 语法 树 

我 们 希望 翻译 方案 的 基础 文法 的 语法 分 析 树 与 抽象 语法 树 尽 可 能 相近 。 图 2-21 中 的 文法 对 
子 表达 式 进 行 分 组 的 方式 与 语法 树 的 分 组 方式 相似 。 例 如 , 加 运算 符 的 子 表达 式 是 由 产生 式 体 
expr + tern 中 的 expr 和 term 给 出 的 。 
2.5.2 调整 翻译 方案 

图 2-20 中 简 述 的 左 递归 消除 技术 同样 可 以 应 用 于 包含 了 语义 动作 的 产生 式 。 首 先 , 该 技术 
被 扩展 到 4 的 多 个 产生 式 中 。 在 我 们 的 例子 中 , 4 就 是 expr, 它 有 两 个 expr 的 左 递归 产生 式 和 一 
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个 非 左 递归 的 产生 式 。 这 个 技术 将 产生 式 A—Aal AB 1 y 转换 成 
A—yR 
R—aR| BR | Ee 
其 次 , 我 们 要 转换 的 产生 式 不 仅 包含 终结 符号 和 非 终结 符号 , OA HE. HLA EPA 
式 中 的 语义 动作 在 转换 时 被 当 作 终 结 符号 直接 进行 复制 。 
DH 考虑 图 221 中 的 翻译 方案 。 令 


A= expr 
a= + term|print('+')} 
B= - term} print('-')} 
y= term 


那么 进行 左 递归 消除 转换 后 将 产生 如 图 2-23 所 示 的 翻译 方案 。 图 2-21 中 的 expr 产生 式 已 经 转换 
W expr 和 新 非 终 结 符号 rest 的 产生 式 , 其 中 rest WT RAAG tem 的 产生 式 就 是 图 221 中 
term 的 产生 式 。 图 2-24 展示 了 使 用 图 2-23 中 的 文法 对 9 -5 +2 进行 翻译 的 过 程 。 O 
expr 

term rest 


+ term { print('+') } rest term rest 、 
= term { print('-') } rest z] | 
€ 9 {print('9')} - term {print(’-')}. ` rest 


0 { print(‘o’) } y He 
1 { print(‘1’) } 5 {print('5’)} + term {print('+')} rest 


9 { print('9’) } 2 {print('2)} € 





图 2-23 “消除 左 递归 后 的 翻译 方案 图 2-24 从 9 -5+2 到 95-2+ 的 翻译 


左 递归 消除 的 工作 必须 小 心 进行 ,以 确保 消除 后 的 结果 保持 语义 动作 的 顺序 。 例 如 , 在 图 2-23 
的 翻译 方案 中 , 动作 | print('+') | 和 |print('-')| 都 处 于 产生 式 体 的 中 间 , 两边 分 别 是 非 终结 符号 
term 和 rest。 假 如 将 这 个 动作 放 到 产生 式 的 末尾 , 即 rest 之 后 , 那么 这 个 翻译 就 是 不 正确 的 。 请 读者 
自己 证 明 , 假如 这 么 做 , 9 - 5 + 2 就 会 被 错误 地 转换 成 952 + -, 它 是 9 - (5 +2) 的 后 级 表示 方 
式 ; 而 我 们 实际 想 要 的 是 952 +-, 即 (9 -5)+2 的 后 缀 表示 方式 。 
2.5.3 非 终结 符号 的 过 程 

图 2-25 中 的 函数 expr、 term Fil rest 实现 了 图 2-23 中 的 语法 制导 翻译 方案 。 这 些 函 数 模拟 了 对 
应 于 非 终结 符号 的 各 个 产生 式 体 。 函 数 expr 先 调用 term( ) 再 调用 rest( ) , 从 而 实现 产生 式 expr —> 
term resto 

函数 rest 实现 了 图 2-23 中 非 终结 符 re 的 三 个 产生 式 ; 如 果 向 前 看 符号 是 加 号 ， 这 个 函数 就 
使 用 第 一 个 产生 式 ; 如 果 向 前 看 符号 是 减 号 , 就 使 用 第 二 个 产生 式 ; 在 其 他 情况 下 使 用 产生 式 
restes 非 终结 符号 rest 的 前 两 个 产生 式 是 用 过 程 rest 中 这 语句 的 前 两 个 分 支 实现 的 。 如 果 向 前 
看 符号 是 +, 就 调用 match('+') 来 匹配 它 。 在 调用 term( ZJE, 相应 的 语义 动作 通过 输出 一 个 
加 号 来 实现 。 第 二 个 产生 式 与 此 类 似 , 只 是 用 - 代替 4 5 因为 rest 的 第 三 个 产生 式 的 右 部 是 e， 
所 以 函数 rest 中 最 后 一 个 else 子 句 不 做 任何 处 理 。 

非 终 结 符号 term 的 十 个 产生 式 生成 十 个 数位 。 因为 每 一 个 产生 式 都 生成 一 个 数位 并 打印 ， 
所 以 在 图 2-25 中 用 相同 的 代码 实现 这 些 产生 式 。 如 果 term() 中 的 条 件 表 达 式 成 立 ， Bit t 中 就 
保存 lookahead 代表 的 数位 , 它 将 在 调用 完 match 之 后 被 打印 出 来 。 注意, match 会 改变 向 前 看 符 


一 个 简单 的 语法 制导 翻译 器 45 











号 , 所 以 我 们 需要 :保存 这 个 数位 , MERTA © 。 


void ezpr() { 
term(); rest(); 
} 


void rest() { 
if ( lookahead == '+' ) { i 
match('+'); term(); print('+'); rest(); 








else if ( lookahead == 一 ) 
match('-'); term(); print('-'); rest(); 


} 
else { } /* 不 对 输入 作 任 何 处 理 * / ; 
void term() { 


if ( ookapead 是 一 个 数位 ) { 
t = lookahead; match(lookahead); print(t); 








} 
else report(" 语 法 错误 " ); 
} 


Ue A NY | 

图 2-25 ARASH FE expr rest 和 term 的 伪 代 码 
2.5.4 翻译 器 的 简化 

在 给 出 完整 的 程序 之 前 , 我 们 将 对 图 2-25 中 的 代码 做 两 处 简化 。 这 个 简化 将 把 过 程 rest 展开 到 过 
程 expr 中 。 在 翻译 具有 多 个 优先 级 的 表达 式 时 , 这 样 的 简化 处 理 可 以 减少 需要 使 用 的 过 程 数 目 。 

首先 , 某 些 递归 调用 可 以 被 替换 为 迭代 。 如 果 一 个 过 程 体 中 执行 的 最 后 一 条 语句 是 对 该 过 
程 的 递归 调用 , 那么 这 个 调用 就 称 为 是 尾 递 归 的 (tail recursive) 。 例 如 , 在 函数 rest 中 ， 当 向 前 看 
符号 为 + 和 -时 对 rest( ) 的 调用 都 是 尾 递 归 的 。 因 为 在 每 个 分 支 中 ,对 rest 的 递归 调用 都 是 调用 
rest 时 执行 的 最 后 一 条 语句 。 

对 于 没有 参数 的 过 程 , 一 个 尾 递 归 调 用 可 以 被 替换 为 跳 转 到 过 程 开关 的 语句 。 过 程 rest 的 代码 
可 以 被 改写 为 图 2-26 中 的 伪 代 码 。 只 要 向 前 看 符号 是 一 个 加 号 或 一 个 减 号 , 过 程 rest 就 和 该 符号 匹 
Bc, 并 调用 term 来 匹配 一 个 数位 , 然后 重复 这 一 过 程 。 否 则 , 它 就 跳出 while 循环 并 从 rest 返回 。 

Void rest() { 

while( true ) { 


if( lookahead == '+' ) { 
match('+'); term(); print('+'); continue; 


J 
else if ( lookahead == '-' 


match('-'); term(); print('-'); continue; 
} 
break ; 





2-26 ”消除 图 2-25 中 过 程 resi 的 尾 递归 
其 次 ， 整个 Java 程序 还 包含 另 一 处 修改 。 一 旦 图 2-25 中 rest 过 程 的 尾 递归 调用 被 蔡 换 为 迭 
代 过 程 ,那么 对 rest 的 调用 仅仅 出 现在 过 程 expr 中 。 因 此 , 将 过 程 expr 中 对 rest 的 调用 替换 为 rest 
的 过 程 体 , 就 可 以 将 这 两 个 函数 合 二 为 一 。 





O 作为 一 个 小 小 的 优化 , 我 们 可 以 在 调用 match 之 前 打印 这 个 数位 ， 避免 将 这 个 数位 保存 起 来 。 一 般 来 说 , 改变 语 
义 动作 和 文法 符号 之 间 的 顺序 是 有 风险 的 , 因为 这 么 做 可 能 改变 这 个 翻译 的 结果 。 
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2.5.5 完整 的 程序 

我 们 的 翻译 器 的 完整 Java 程序 显示 在 图 2.27 H, 第 一 行 以 import 开头 ,使 得 程序 可 以 访 
间 java.io 包 以 进行 系统 输入 和 输出 。 其 余 的 代码 包括 两 个 类 : Parser fl Postfix, X Par- 
ser 包含 变量 lookahead 和 函数 Parser、expr、term 和 match。 





import java.io.*; 
class Parser { 
static int lookahead; 


public Parser() throws I0Exception { 
lookahead = System.in.read(); 
} 


void expr() throws I0Exception { 
term(); s 
while(true) { 
if( lookahead == '+' ) { 
match('+'); term(); System.out.write('+'); 
} 
else if( lookahead == '-' ) { 
match('-'); term(); System.out.write('-'); 
} 


else return; 
} 


void term() throws IOException { 
if( Character.isDigit ((char) lookahead) ) { 
System.out.write( (char) lookahead); match(lookahead) ; 
} 
else throw new Error("syntax error") ; 


J 


void match(int t) throws IOException { i 
if( lookahead == t ) lookahead = System.in.read(); 
else throw new Error("syntax error"); 


j; 


public class Postfix { 
public static void main(String[] args) throws IOException { 
Parser parse = new Parser(); 
parse.expr(); System.out.write('\n'); 


} 





E 2-27 oH PARAM K ARKAN Java 程序 


程序 的 执行 从 类 Postfix 中 定义 的 函数 main 开始 。 函 数 main 创建 了 一 个 Parser 类 的 
实例 parse, 然后 调用 它 的 函数 expr 对 一 个 表达 式 进 行 语 法 分 析 。 

和 类 Parser 同名 的 函数 Parser 是 该 类 的 构造 函数 ( constructor)， 它 在 创建 该 类 的 一 个 对 
象 时 自动 调用 。 请 注意 , 根据 类 Parser 开始 处 的 定义 , 构造 函数 Parser 读 人 一 个 词法 单元 ， 
并 将 变量 lookahead 初始 化 为 这 个 词法 单元 。 由 单个 字符 组 成 的 词法 单元 是 由 系统 输入 例 程 
read 提供 的 , 该 子 程序 从 输入 文件 中 读 取 下 一 个 字符 。 注 意 ,，lookahead 被 声明 为 整 型 变量 ， 
而 不 是 字符 型 变量 。 这 是 为 了 便于 在 后 面 引入 非 单个 字符 的 其 他 词法 单元 。 

函数 expr 是 2. 5.4 节 中 讨论 的 简化 处 理 的 结果 。 它 实现 了 图 2223 中 的 非 终结 符号 expr 和 
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rest, K| 2-27 中 expr 的 代码 首先 调用 term, 然后 用 一 个 while 循环 不 断 测 试 lookahead EF 
和 + 或 -匹配 。 当 运行 到 代码 中 的 return 语 名 时 ， 控制 流离 开 这 个 while 循环 。 在 循环 内 部 ， 
system 类 的 输入 /输出 功能 用 来 写 一 个 字符 。 

函数 term 使 用 Java 类 Character 中 的 例 程 isDigit 来 判断 向 前 看 符号 是 否 为 一 个 数位 。 
例 程 isDigit 的 参数 是 一 个 字符 。 然 而 , 为 了 方便 将 来 的 扩展 ,lookahead 被 声明 为 整 型 变 
fi, (char) lookahead 将 lookahead 的 类 型 强制 转化 (cast) 为 字符 。 和 图 2-25 相 比 , 这 里 有 
一 个 小 的 改动 ,， 即 输出 向 前 看 字符 的 语义 动作 在 调用 match 之 前 就 执行 了 。 

函数 match 检查 终结 符号 。 如 果 向 前 看 符号 是 匹配 的 , 它 就 读 取 下 一 个 输入 终结 符号 ， 否则 
它 执行 下 面 的 代码 , 发 出 出 错 消息 。 


throw new Error("syntax error") ; 


正 述 代码 创建 了 类 Error 的 一 个 新 异常 , 并 将 “syntax error” 作 为 其 错误 消息 。Java 并 不 强制 
要 求 在 throw 子 句 中 声明 Error RH, 因为 这 些 异 常 的 本 意 是 表示 不 应 该 发 生 的 不 正常 事件 ,9 





Java 的 一 些 主要 特征 
对 于 不 熟悉 Java 的 读者 来 说 , 下 面 的 一 些 注解 有 助 于 他 们 阅读 图 2-27 中 的 代码 : 
。 一 个 Java 的 类 由 变量 和 函数 定义 的 序列 组 成 。 
。 函数 ( 例 程 ) 的 参数 列表 用 括号 括 起 来 , 即使 没有 参数 也 需要 写 出 括号 , ;因此 我 们 写成 
expr() 和 term( )。 这 些 函 数 实际 上 是 过 程 , 因为 它们 的 函数 名 字 前 面 的 关键 字 
void 表示 它们 没有 返回 值 。 
函数 之 间 通 信 时 可 以 通过 “ 值 传递 方式 ”传递 参数 , 也 可 以 通过 访问 共享 数据 进行 通 
信 。 比 如 , 函数 expr() 和 term( ) 使 用 类 变量 lookahead 来 检查 向 前 看 符号 。 这 
两 个 函数 都 可 以 访问 这 个 类 变量 ,因为 它们 同属 于 类 Parser, 
和 C 语言 一 样 , Java 语言 使 用 = 表示 赋值 , == 表示 等 于 ,1= 表 示 不 等 于 。 
term( ) 定 义 中 的 子 句 “throw IOException” 声 明 该 函数 在 执行 时 可 能 会 出 现 一 个 
名 为 IOException 的 异常 。 当 函数 match 调用 例 程 read 时 ,如 果 无 法 读 到 输入 就 
会 出 现 这 样 的 异常 。 任 何 调用 了 match 的 函数 也 必须 声明 在 该 函数 运行 时 可 能 出 现 
一 个 IOException 异常 。 














2.6 词法 分 析 


一 个 词法 分 析 器 从 输入 中 读 取 字符 , 并 将 它们 组 成 “词法 单元 对 象 ”。 除了 用 于 语法 分 析 的 
终结 符号 之 外 ,一 个 词法 单元 对 象 还 包含 一 些 附加 信息 , 这 些 信息 以 属性 值 的 形式 出 现 。 至 今 为 
止 , 我 们 还 不 需要 区 分 术语 “词法 单元 "和 “终结 符号 ”因为 语法 分 析 器 忽略 了 词法 单元 中 带 有 





O 错误 处 理 可 以 使 用 Java 的 异常 处 理 机 制 来 实现 。 方 法 之 一 是 声明 一 个 扩展 了 系统 类 Exception 的 新 的 异常 ， 比 
如 syntaxError。 然后 在 term 或 match 中 检测 到 错误 时 抛 出 SyntaxError 异常 ,而 不 是 Error 异常 。 然 后 
在 main 中 把 对 parse. expr() 的 调用 放 在 一 个 try 语句 中 。 该 try 语句 可 以 捕获 SyntaxError 异常 , 输出 
一 个 消息 并 结束 。 如 果 这 么 做 , 我 们 将 需要 在 图 2-27 的 程序 中 加 入 一 个 类 SyntaxError。 要 完成 这 个 扩展 , 我 
们 还 必须 修改 match 和 term 的 声明 ;使 得 它们 不 仅 可 以 抛 出 IOBxception, 还 可 以 抛 出 SyntaxError。 同 
时 也 必须 重新 声明 调用 它们 的 函数 expr, 使 得 它 可 以 抛 出 SyntaxError 异常 。 
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的 属性 值 。 在 本 节 中 , 一 个 词法 单元 就 是 一 个 带 有 附加 信息 的 终结 符号 。 
构成 一 个 词法 单元 的 输入 字符 序列 称 为 词素 (lexem)。 因 此 , 我 们 可 以 说 , 词法 分 析 器 使 得 
语法 分 析 器 不 需要 考虑 词法 单元 的 词素 表示 方式 。 


本 节 的 词法 分 析 器 允许 在 表达 式 中 出 现 数字 、 i ea 
标识 符 和 “空白 "(空格 、 制 表 符 和 换行 符 )。 它 可 pop 
以 用 于 扩展 上 一 节 中 介绍 的 表达 式 翻 译 器 。 要 多 term factor { print) } 
许 在 表达 式 中 出 现 数字 和 标识 符 ， 就 必须 扩展 图 i 
2.21 中 的 表达 式 文法 。 借 此 机 会 我 们 还 将 使 扩展 
后 的 文法 支持 乘法 和 除法 运算 。 扩 展 后 的 翻译 方 |" reer 
案 如 图 2-28 所 示 。 i { print(id.lexeme) } 





在 图 2-28 中 , 假定 终结 符号 num 具有 属性 
mum, value, BAHAET SYF num 的 本 次 出 现 ” 图 2.28 1 翻译 得 到 后 级 表示 方式 的 语义 动作 
的 整数 值 。 终 结 符号 id 有 一 个 值 为 字符 串 类 型 的 属性 , 写作 id. Jexeme。 我 们 假设 这 个 字符 串 就 
是 这 个 id 实例 的 实际 词素 。 

在 本 节 结 束 时 , 这 些 被 用 来 演示 词法 分 析 器 的 工作 方式 的 伪 代 码 片段 将 被 组 合成 Java 代码 。 
本 节 中 介绍 的 方法 适合 于 手写 的 词法 分 析 器 。3. 5 节 描 述 了 一 个 可 根据 一 个 词法 规范 生成 词法 分 
析 器 的 工具 Lex。 用 于 保存 标识 符 相关 信息 的 符号 表 或 数据 结构 将 在 2. 7 节 中 讨论 。 

2.6.1 ”剔除 空白 和 注释 

2.5 节 的 表达 式 翻译 器 读 取 输 入 中 的 每 个 字符 ,所 以 任何 无 关 字符 ， 比 如 空格 ,都 会 使 它 运 
行 失 败 。 大 部 分 语言 允许 词法 单元 之 间 出 现任 意 数量 的 空白 。 在 语法 分 析 过 程 中 同样 会 忽略 源 
程序 中 的 注释 , 所 以 这 些 注 释 也 可 以 当 作 空白 处 理 。 

如 果 词 法 分 析 器 消除 了 空白 , 那么 语法 分 析 器 就 不 必 再 考虑 它们 了 。 当 然 , 也 可 以 修改 文法 使 
得 语法 中 包含 空白 , 但 是 实现 这 个 方法 远 非 易 事 。 

图 2-29 中 的 伪 代 码 在 遇 到 空格 ` 制 表 符 或 换行 ‘if ( peek is a blank or a tab ) do nothing; 
符 时 不 断 读 取 输入 字符 ,从 而 跳 过 了 空 自 部 分 。 变 et 
量 peek 存放 了 下 一 个 输入 字符 。 在 错误 消息 中 加 入 |} 

行 号 和 上 下 文 有 助 于 定位 错误 。 这 个 代码 使 用 变量 
line 统计 输入 中 的 换行 符 个 数 。 图 2-29 “ 跳 过 空白 部 分 
2.6.2 MİZ 

在 决定 向 语法 分 析 器 返回 哪个 词法 单元 之 前 , 词法 分 析 器 可 能 需要 预先 恋人 一 些 字符 。 例 
如 , CR Java 的 词法 分 析 器 在 遇 到 字符 > 之 后 必须 预先 读 入 一 个 字符 。 如 果 下 一 个 字符 是 = , OB 
么 > 就 是 字符 序列 >= 的 一 部 分 , 这 个 序列 是 代表 “大 于 等 于 ”运算 符 的 词法 单元 的 词素 。 否则 > 
本 身 形成 了 “大 于 ”运算 符 , 词法 分 析 器 就 多 读 了 一 个 字符 。 

一 个 通用 的 预先 读 取 输入 的 方法 是 使 用 输入 缓冲 区 。 词 法 分 析 器 可 以 从 缓冲 区 中 读 取 一 个 
字符 , 也 可 以 把 字符 放 回 缓冲 区 。 即 使 仅 从 效率 的 角度 看 , 使 用 缓冲 区 也 是 有 意义 的 , 因为 一 次 
读 取 一 块 字符 要 比 每 次 读 取 单个 字符 更 加 高 效 。 我 们 可 以 用 一 个 指针 来 跟踪 已 被 分 析 的 输入 部 
分 , 向 缓冲 区 放 回 一 个 字符 可 以 通过 回 移 指针 来 实现 。 输 入 缓冲 技术 将 在 3. 2 节 中 讨论 。 

因为 通常 只 需 预 读 一 个 字符 , 所 以 一 种 简单 的 解决 方法 是 使 用 一 个 变量 ,比如 peek, 来 保存 下 
一 个 输入 字符 。 在 读 和 人 一 个 数字 的 数位 或 二 个 标识 符 的 字符 时 , 本 节 的 词法 分 析 器 会 预 读 一 个 字 
符 。 例 如 , 它 在 1 后 面 预 读 一 个 字符 来 区 分 1 和 10, E t 后 预 读 一 个 字符 来 区 分 t 和 true, 
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词法 分 析 器 只 在 必要 时 才 进 行 预 读 。 像 * 这 样 的 运算 符 不 需 预 读 就 能 够 识别 。 在 这 种 情况 
F, peek 的 值 被 设置 为 空白 符 。 词 法 分 析 器 在 寻找 下 一 个 词法 单元 时 会 跳 过 这 个 空白 符 。 本 节 中 
的 词法 分 析 器 的 不 变 式 断 言 如 下 局 当 词法 分 析 器 返回 一 个 词法 单元 时 ,变量 peck 要 么 保存 了 当前 
词法 单元 的 词素 后 的 那个 字符 ， 要 么 保存 空白 符 。 
2.6.3 常量 

在 一 个 表达 式 的 文法 中 , 任何 允许 出 现 数位 的 地 方 都 应 该 允许 出 现任 意 的 整 型 常量 。 要 使 
得 表达 式 中 可 以 出 现 整数 常量 , 我 们 可 以 创建 一 个 代表 整 型 常量 的 终结 符号 ， 比 如 num, 也 可 以 
将 整数 常量 的 语法 加 入 到 文法 中 。 将 字符 组 成 整数 并 计算 它 的 数值 的 工作 通常 是 由 词法 分 析 器 
完成 的 , 因此 在 语法 分 析 和 翻译 过 程 中 可 以 将 数字 当 作 一 个 单元 进行 处 理 。 

当 在 输入 流 中 出 现 一 个 数位 序列 时 , 词法 分 析 器 将 向 语法 分 析 髓 传送 一 个 词法 单元 。 该 词 
法 单元 包含 终结 符号 num 及 根据 这 些 数 位 计算 





if ( peek holds a digit ) { 


得 到 的 整 型 属性 值 。 如 果 我 们 把 词法 单元 写成 用 ges. 
() FTCA, 那么 输入 31 +28 +59 就 被 转 do { 到 

v = ux 10 + integer value of digit. peek; 
换 成 序列 peek = next input character; 


} while ( peek holds a digit ); 
return token (num, v); 


(num, 31)( +) (num, 28) ( + (num, 59) 

在 这 里 , 终结 符号 + 没有 属性 , 所 以 它 的 元 组 
就 是 (+1》。 图 2-30 中 的 伪 代 码 读 取 一 个 整数 中 的 
数位 , 并 用 变量 o 累计 得 到 这 个 整数 的 值 。 图 2-30 将 数位 组 成 整数 
2.6.4 识别 关键 字 和 标识 条 

大 多 数 程序 设计 语言 使 用 for, do, if 这 样 的 固定 字符 串 作为 标点 符号 , 或 者 用 于 标识 
种 构造 。 这 些 字 符 串 称 为 关键 字 ( keyword ) 。 

字符 串 还 可 以 作为 标识 符 , 来 为 变量 、 数组、 函数 等 命名 。 为 了 简化 语法 分 析 器 , 语言 的 文 
法 通常 把 标识 符 当 作 终 结 符号 进行 处 理 。 当 某 个 标识 符 出 现在 输入 中 时 , 语法 分 析 器 都 会 得 到 
相同 的 终结 符号 , 如 id。 例 如 , 在 处 理 如 下 输入 时 

count = count + increment; (2.6) 
语法 分 析 器 处 理 的 是 终结 符号 序列 id = id + id。 词 法 单元 id 有 一 个 属性 保存 它 的 词素 。 
将 词法 单元 写作 元 组 形式 , 我 们 看 到 输入 流 (2. 6) 的 元 组 序列 是 
(id, "count") (=) (id, count") (+) (id, increment") (;) 

关键 字 通 常 也 满足 标识 符 的 组 成 规则 , 因此 我 们 需要 某 种 机 制 来 确定 一 个 词素 什么 时 候 组 
成 一 个 关键 字 , 什么 时 候 组 成 一 个 标识 符 。 如 果 将 关键 字 作 为 保留 字 , 也 就 是 说 , 如果 它 们 不 能 
被 用 作 标 识 符 , 这 个 问题 相对 容易 解决 。 此 时 , 只 有 当 一 个 字符 串 不 是 关键 字 时 它 才 能 组 成 一 个 
标识 符 。 

本 节 中 的 词法 分 析 器 使 用 一 个 表 来 保存 字符 串 , 从 而 解决 了 如 下 两 个 问题 : 

© 单一 表示 。 一 个 字符 串 表 可 以 将 编译 器 的 其 余部 分 和 表 中 字符 串 的 具体 表示 隔离 开 , 因 

为 编译 器 后 面 的 步骤 可 以 只 使 用 指向 表 中 字符 串 的 指针 或 引用 。 操 作 引 用 要 比 操作 字符 
串 本 身 更 加 高 效 。 

。 保留 字 。 要 实现 保留 字 , 可 以 在 初始 化 时 在 字符 串 表 中 加 入 保留 的 字符 串 以 及 它们 对 应 
的 词法 单元 。 当 词法 分 析 器 读 到 一 个 可 以 组 成 标识 符 的 字符 串 或 词素 时 , 它 首先 检查 这 
个 字符 串 表 中 是 否 有 这 个 词素 。 如 是 ， 它 就 返回 表 中 的 词法 单元 , 否则 返回 带 有 终结 符 
号 id 的 词法 单元 。 
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在 Java 中 , 使 用 类 Hashtable 可 以 将 一 个 字符 串 表 实现 为 一 张 散 列 表 。 下 面 的 声明 
Hashtable words = new Hashtable( ) ; 
将 words 初始 化 为 一 个 将 键 映射 到 值 的 默认 散 列 表 。 我 们 将 使 用 它 来 实现 从 词素 到 词法 单元 的 映 
射 。 图 2-31 中 的 伪 代 码 使 用 get 操作 来 查找 保留 字 。 


PR gpro ee if ( peck 存放 了 一 个 字母 ) { 
这 个 伪 代 码 从 输入 中 读 取 一 个 以 字母 开头 、 由 字母 PA 将 字母 或 数位 读 入 一个 缓 让 区 





和 数位 组 成 的 字符 串 s。 我 们 假定 读 取 的 * 尽 可 能 s 二 5 中 的 字符 形成 的 字符 串 ; 

地 长 ， 即 只 要 词法 分 析 器 遇 到 字母 或 数位 ， 它 就 不 ogee Pose edi 

断 从 输入 中 读 取 字符 。 当 它 遇 到 的 不 是 字母 或 数 else { 

位 ,比如 它 遇 到 了 空白 符 , 已 读 取 的 词素 就 被 复制 人 
到 缓冲 区 中 。 如 果 字符 串 表 中 已 经 有 一 个 * 的 条 } 

目 , 它 就 返回 由 words. get 得 到 的 词法 单元 。 这 里 

可 能 是 一 个 关键 字 , ER words 初始 化 的 时 候 这 个 s et ee 


就 已 经 在 表 中 了 ; 它 也 可 能 是 一 个 之 前 被 加 入 到 表 
中 的 标识 符 。 如 果 不 存 在 对 应 的 条 目 , 那么 由 id 和 属性 值 * 组 成 的 词法 单元 将 被 加 入 到 字符 串 
KP, 并 被 返回 。 
2.6.5 词法 分 析 器 
将 本 节 到 目前 为 止 给 出 的 伪 代 码 片 段 组 合 起 来 , 就 可 以 得 到 一 个 返回 词法 单元 对 象 的 函数 
scan。 如 下 所 示 : 
Token scan( ) | 
跳 过 空白 符 , 见 2.6.1 节 ; 
处 理 数字 , 见 2. 6.3 节 ; 
处 理 保留 字 和 标识 符 , 见 2. 6.4 节 ; 
/* 如 果 我 们 运行 到 这 里 ,就 将 预 读 字符 peek 作为 一 个 词法 单元 */ 
Token t = new Token( peek) ; 
peek = 2 APE / * {kH 2.6.2 讨论 的 方法 初始 化 *7; 
return i; 


} 
本 节 的 其 余部 分 将 函数 scan 实现 为 一 个 用 于 词法 分 析 的 Java 程序 包 的 一 部 分 。 这 个 叫做 


lexer 的 包 中 包含 对 应 于 各 种 词法 单元 的 类 和 一 类 Tbhen 
个 包含 函数 scan 的 类 Lexer。 
图 2-32 中 显示 了 对 应 于 各 个 词法 单元 的 类 类 Num 类 Word 
及 它们 的 字段 , 但 图 中 没有 给 出 它们 的 方法 。 类 


Token 有 一 个 tag 字段 ， 它 用 于 做 出 语法 分 析 图 2-32 ”类 Token 以 及 子 类 Num 和 Work 
决定 。 子 类 Num 增加 了 一 个 用 于 存放 整数 值 的 
字段 value; F% word 增加 了 一 个 字段 lexeme, 用 于 保存 关键 字 和 标识 符 的 词素 。 

每 个 类 都 在 以 它 的 名 字 命 名 的 文件 中 。Token 类 的 文件 内 容 如 下 : 


1) package lexer; // 文件 Token.java 
2) public class Token { 

3) public final int tag; 

4) public Token(int t) { tag = t; } 

5) } 


第 一 行 指明 了 lexer 包 。 第 3 行 声明 了 字段 tag 为 final 的 , 即 它 一 旦 被 赋值 就 不 能 再 修改 。 第 
4 行 上 的 构造 函数 Token 用 于 创建 词法 单元 对 象 ， 比如 
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new Token('+') 
创建 了 Token 类 的 一 个 新 对 象 , 并 且 把 它 的 tag 字段 初始 化 为 "+ HRM. (WIL, 
我 们 省 略 了 常用 的 方法 fosString。 该 方法 将 返回 一 个 适 于 打印 的 字符 串 。) 

在 伪 代 码 中 使 用 诸如 num, id 这 样 的 终结 符号 的 地 方 , Java 代码 中 使 用 整 型 常量 表示 。 类 
Tag 实现 了 这 些 常 量 : 


1) package lexer; // 文件 Tag.java 

2) public class Tag { 

3) public final static int 

4) NUM = 256, ID = 257, TRUE = 258, FALSE = 259; 
5) } 


除了 值 为 整数 的 字段 NUM 和 ID 外 , 这 个 类 还 定义 了 两 个 字段 TRUE Al FALSE 以 备 后 用 , € 
们 将 用 于 演示 如 何 处 理 保留 的 关键 字 。9 

Tag 类 中 的 字段 是 public 的 , 因此 它们 可 以 在 包 的 外 面 使 用 。 它 们 同时 也 是 static 的 ， 
因此 这 些 字段 只 能 有 一 个 实例 , 或 者 说 拷贝 。 这 些 字段 是 final 的 , 因此 它们 只 能 被 赋值 一 次 。 
事实 上 , 这 些 常量 就 代表 常量 。 在 C 语言 中 , 可 以 使 用 define 语句 来 获得 类 似 的 效果 。 这 些 
define 语 句 使 得 NUM 这样 的 名 字 可 以 被 当 作 符号 常量 使 用 , 例如 : 

#define NUM 256 

在 伪 代 码 引 用 终结 符号 num 和 id 的 地 方 , Java 代码 引用 的 是 Tag. NUM 和 Tag.ID。 了 唯一 的 
要 求 是 Tag. NUM 和 Tag. ID 必须 被 
初始 化 为 互 不 相同 的 值 , 且 这 些 初始 
化 值 还 必须 不 同 于 那些 代表 单字 符 词 
法 单元 (比如 “+ ”或 “*”) 的 常量 。 

类 Num 和 Word 显示 在 图 2-33 
中 。 类 Num 通过 在 第 3 行 声 明 一 个 整 
数字 段 value 而 扩展 了 Token。 第 4 
行 的 构造 函数 Num 调用 了 super 
(Tag. NUM), 该 函数 把 其 父 类 Token 
的 tag 字段 设 定 为 Tag.NUM。 

类 Word 既 可 用 于 保留 字 , 也 可 
用 于 标识 符 , 因此 第 4 行 上 的 构造 函数 Word 需要 两 个 参数 : 一 个 词素 和 一 个 与 tag 对 应 的 整数 
值 。 一 个 用 于 保留 字 true 的 对 象 可 以 通过 以 下 语句 创建 : 

new Word(Tag.TRUE, "true") 
这 个 语句 创建 了 一 个 新 对 象 , 该 对 象 的 tag 字段 被 设 为 rag. TRUE, lexeme 字段 被 设 为 字符 串 
Erie” 3 

用 于 词法 分 析 的 类 Lexer 显示 在 图 2-34 和 图 2-35 中 。 第 4 行 上 的 整 型 变量 line 用 于 对 输 
信行 计数 , 第 5 行 上 的 字符 变量 peek 用 于 存放 下 一 个 输入 字符 。 

保留 字 在 第 6 行 到 第 11 行 处 理 。 第 6 行 声 明了 表 words。 第 7 行 上 的 辅助 函数 reserve 
将 一 个 字符 串 - 字 对 放 和 人 这 个 表 中 。 构 造 函 数 Lexer 中 的 第 9 行 和 第 10 行 初 始 化 这 个 表 。 它 们 
使 用 构造 函数 Word 来 创建 字 对 象 , 这 些 对 象 被 传递 到 辅助 函数 reserve, Ak, 在 第 一 次 调用 
scan 之 前 , 这 个 表 被 初始 化 , 并 且 预 先 加 入 了 保留 字 “true” 和 “false”。 


package lexer; /1 文件 Num.java 
‘public class Num extends Token { 

public final int value; 

public Num(int v) { super(Tag.NUM); value = v; } 


package lexer; // 文件 Word.java 
public class Word extends Token { 
public final String lexeme; 
public Word(int t, String s) { 
super(t); lexeme = new String(s); 





1) 
2) 
3) 
4) 
5) } 
1) 
2) 
3) 
4) 
5) 
6) 
7) 


w 


K| 2-33 Token 的 子 类 Num 和 Word 





O ASCH 字符 通常 被 转化 为 0 ~ 255 之 间 的 整数 。 因 此 我 们 用 大 于 255 的 整数 来 表示 终结 符号 。 
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1) package lexer; // 文 件 Lerer.java 

2) import java.io.*; import java.util. *; 

3) public class Lexer { 

4) public int line = 1; 

5) private char peek = ? 7; 

6) private Hashtable words = new Hashtable() ; 

T) void reserve(Word t) { words.put(t.lexeme, moa 
8) public Lexer() { 

9) reserve( new Word(Tag.TRUE, "true") ); 

10) reserve( new Word(Tag.FALSE, "false") )5 

11) } 

12) public Token scan() throws IOException { 

13) for( ; ; peek = (char)System.in.read() ) { 
14) if( peek == °? ’ || peek == ’\t’ ) continue; 
15) else if( peek == ’\n’ ) line = line + ts 
16) else break; 

17) 


F 
od /* E 2-35*/ 
图 2-34， 词法 分 析 器 的 代码 (第 1 部分) 











18) if( Character.isDigit(peek) ) { 

19) int v = 0; 

20) do { 

21) v = 10*v + Character.digit (peek, 10); 
22) peek = (char)System.in.read(); 
23) } while( Character.isDigit (peek) ); 
24) return new Num(v) ; 

25) } 

26) if( Character.isLetter(peek) ) { 

27) StringBuffer b = new StringBuffer(); 
28) do { 

29) b. append (peek) ; 

30) peek = (char)System.in.read() ; 
31) } while( Character.isLetterOrDigit (peek) ); 
32) String s = b.toString(); 

33) Word w = (Word)words.get(s) ; 

34) if( w != null ) return w; 

35) w = new Word(Tag.ID, s); 

36) words.put(s, w); 

37) return W; 

38) } 

39) Token t = new Token(peek) ; 

40) peek =’ ?; : 





41) return t; 
È } 
43) } 
图 2-35 词法 分 析 器 的 代码 (第 2 部 分 ) 

在 图 2-34 和 图 2-35 F, scan 的 代码 实现 了 本 节 中 的 各 个 伪 代 码 片段 。 从 第 13 行 到 第 17 行 
的 for 语句 跳 过 了 空格 、 制 表 符 和 换行 符 。 当 peek 的 值 不 是 空白 符 时 , 控制 流离 开 for 循环 。 

第 18 行 到 第 25 行 的 代码 读 取 一 个 数位 序列 。 函 数 isDigit 来 自 于 Java 的 内 置 类 Charac- 
ter。 它 在 第 18 行 上 用 于 检查 peck 是 否 为 一 个 数位 。 如 是 , 第 19 行 到 第 24 行 的 代码 就 会 累积 
计算 输入 中 的 数位 序列 对 应 的 整数 值 , 然后 返回 一 个 新 的 Num 对象 。 

第 26 行 到 第 38 行 分 析 了 保留 字 和 标识 符 。 关 键 字 true 和 false 已 经 在 第 9 行 和 第 10 行 被 保 
AT. Kik, WRZE s 不 是 保留 字 , 则 程序 就 会 执行 第 35 行 , 此 时 s 一 定 是 某 个 标识 符 的 
词素 。 因 此 第 35 行 返回 一 个 新 的 word WAR, 该 对 象 的 lexeme 字段 被 设 为 s, tag 字段 被 设 为 
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tag. ID。 最 后 , 第 39 行 到 第 41 行将 当前 字符 作为 一 个 词法 单元 返回 ; 并 把 peek WAP aE 
格 。 当 下 一 次 调用 scan 时 , 这 个 空格 会 被 删除 。 
2.6.6 2.6 节 的 练习 

练习 2. 6. 1: 扩展 2.6.5 节 中 的 词法 分 析 器 以 消除 注释 。 注 释 的 定义 如 下 : 

1) 以 ZX 开始 的 注释 , 包括 从 它 开 始 到 这 一 行 的 结尾 的 所 有 字符 。 

2) 以 /x 开始 的 注释 , 包括 从 它 到 后 面 第 一 次 出 现 的 字符 序列 * /之 间 的 所 有 字符 。 


练习 2.6.2: 扩展 2.6.5 节 中 的 词法 分 析 器 , 使 它 能 够 识别 关系 运算 符 < <ay cay las 
Par Po 

练习 2. 6. 3: 扩展 2. 6. 5 节 中 的 词法 分 析 器 , 使 它 能 够 识别 浮 点 数 , 比如 2. . 3.14 和 .5 等 。 
2.7 HSR 


符号 表 (symbol table) 是 一 种 供 编译 器 用 于 保存 有 关 源 程序 构造 的 各 种 信息 的 数据 结构 。 这 
些 信息 在 编译 器 的 分 析 阶段 被 逐步 收集 并 放 人 符号 表 , 它们 在 综合 阶段 用 于 生成 目标 代码 。 答 
号 表 的 每 个 条 目 中 包含 与 一 个 标识 符 相 关 的 信息 ,比如 它 的 字符 串 ( 或 者 词素 )、 它 的 类 型 、 它 的 
存储 位 置 和 其 他 相关 信息 。 符 号 表 通 常 需要 支持 同一 标识 符 在 一 个 程序 中 的 多 重 声明 。 

从 1.6.1 节 介绍 的 内 容 可知 , 一 个 声明 的 作用 域 是 指 该 声明 起 作用 的 那 一 部 分 程序 。 我 们 将 
为 每 个 作用 域 建立 一 个 单独 的 符号 表 来 实现 作用 域 。 每 个 带 有 声明 的 程序 块 都 会 有 自己 的 符 
号 表 , 这 个 块 中 的 每 个 声明 都 在 此 符号 表 中 有 一 个 对 应 的 条 目 。 这 种 方法 对 其 他 能 够 设立 作用 
域 的 程序 设计 语言 构造 同样 有 效 。 例 如 , 每 个 类 也 可 以 拥有 自己 的 符号 表 , 它 的 每 个 域 和 方法 都 
在 此 表 中 有 一 个 对 应 的 条 目 。 

本 节 包 括 一 个 符号 表 模块 , 它 可 以 和 本 章 中 的 Java 翻译 器 代码 片段 一 起 使 用 。 当 我 们 在 附 
SRA 中 将 这 个 翻译 器 集成 到 一 起 时 可 以 直接 使 用 这 个 模块 。 同 时 , 为 了 简化 问题 , 本 市 的 主要 例 
子 是 一 个 被 简化 了 的 语言 , 它 只 包含 与 符号 表 相 关 的 关键 构造 ,比如 块 、 声 明 、 因 子 等 。 所 有 其 
他 的 语句 和 表达 式 构造 都 被 忽略 了 ， 这 使 得 我 们 可 以 重点 关注 符号 表 的 操作 。 一 个 程序 由 多 个 
KHAR, 每 个 块 包含 可 选 的 声明 和 由 单个 标识 符 组 成 的 语句 。 每 个 这 样 的 语句 都 表示 对 相应 标 
识 符 的 一 次 使 用 。 下 面 是 这 个 语言 的 一 个 例子 程序 : 

(ante xs char yi 1 bool yo xe pele yet (2T) 
1. 6.3 节 中 块 结构 的 例子 处 理 了 名 字 的 定义 和 使 用 。 输 入 (2.7) 仅 仅 由 名 字 的 定义 和 使 用 组 成 。 

我 们 将 要 完成 的 任务 是 打印 出 一 个 修改 过 的 程序 , 程序 中 的 声明 部 分 已 经 被 删除 ， 而 每 个 

“语句 ”中 的 标识 符 之 后 都 跟着 一 个 冒号 和 该 标识 符 的 类 型 。 


谁 来 创建 符号 表 条 目 ? 

符号 表 条 目 是 在 分 析 阶 段 由 词法 分 析 器 、 语法 分 析 器 和 语义 分 析 器 创建 并 使 用 的 。 在 本 章 中 ， 
我 们 让 语法 分 析 器 来 创建 这 些 条 目 。 因 为 语法 分 析 器 知道 一 个 程序 的 语法 结构 ,因此 相对 于 词法 
分 析 器 而 言 , 语法 分 析 器 通常 更 适合 创建 条 目 。 它 可 以 更 好 地 区 分 一 个 标识 符 的 不 同 声明 。 

在 有 些 情况 下 , 词法 分 析 器 可 以 在 它 碰 到 组 成 一 个 词素 的 字符 串 时 立刻 建立 一 个 符号 表 
条 目 。 但 是 在 更 多 的 情况 下 , 词法 分 析 器 只 能 向 语法 分 析 器 返回 一 个 词法 单元 , 比如 id, 以 
及 指向 这 个 词素 的 指针 。 只 有 语法 分 析 器 才能 够 决定 是 使 用 之 前 已 创建 的 符号 表 条 目 , 还 是 
为 这 个 标识 符 创 建 一 个 新 条 目 。 


























O kein, 在 C 语 言 中 , 程序 块 要 么 是 一 个 函数 , 要 么 是 函数 中 由 花 括号 分 隔 的 一 个 部 分 , 这 个 部 分 中 有 一 个 或 多 个 声明 。 
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DA 在 处 理 上 面 的 输入 (2.7) 时 , 目标 是 生成 

{ { x:int; y:bool; } x:int; y:char; } 
第 一 个 x 和 y 来 自 输 入 (2.7) 的 内 层 块 。 由 于 x 的 使 用 指向 外 层 块 中 x 的 声明 , 因此 第 一 个 x 后 
面 跟 的 是 int， 即 该 声明 中 的 类 型 。 内 层 块 中 对 y 的 使 用 指向 同一 个 块 中 的 声明 , 因此 具有 布尔 
类 型 。 我 们 同时 看 到 ,外 层 块 中 x 和 vy 的 使 用 的 类 型 分 别 为 整 型 和 字符 型 , 也 就 是 外 层 块 中 声明 
所 指定 的 类 型 。 oO 
2.7.1 为 每 个 作用 域 设置 一 个 符号 表 

术语 “标识 符 x 的 作用 域 ”实际 上 指 的 是 * 的 某 个 声明 的 作用 域 。 术 语 作用 域 (scope) 本 身 是 
指 一 个 或 多 个 声明 起 作用 的 程序 部 分 。 

作用 域 是 非常 重要 的 ， 因 为 在 程序 的 不 同 部 分 ,可 能 会 出 于 不 同 的 目的 而 多 次 声明 相同 的 标 
识 符 。 像 x Mi 这 样 常见 的 名 字 会 被 重复 使 用 。 再 例如 , 子 类 可 以 重新 声明 一 个 方法 名 字 以 覆 
盖 父 类 中 的 相应 方法 。 

如 果 程序 块 可 以 嵌 套 , 那么 同一 个 标识 符 的 多 次 声明 就 可 能 出 现在 同一 个 块 中 。 当 stmts 能 
生成 一 个 程序 块 时 , 下 面 的 语法 规则 会 产生 舱 套 的 块 : 

block — '{' decls stmts '}' 

(我 们 对 这 个 语法 中 的 花 括 号 使 用 了 引号 , 这 么 做 的 目的 是 将 它们 和 用 于 语义 动作 的 花 括号 区 分 
开 来 。) 在 图 2-38 给 出 的 文法 中 , decks 生成 一 个 可 选 的 声明 序列 ,stmts 生成 一 个 可 选 的 语句 序列 。 
更 进一步 ,一 条 语句 可 以 是 一 个 程序 块 , 所 以 我 们 的 语言 支持 嵌 套 的 语句 块 。 而 标识 符 可 以 在 这 
些 块 中 重新 声明 。 





块 的 符号 表 的 优化 

块 的 符号 表 的 实现 可 以 利用 作用 域 的 最 近 嵌 套 规则 。 嵌 套 的 结构 确保 可 应 用 的 符号 表 形 
成 一 个 栈 。 在 栈 的 顶部 是 当前 块 的 符号 表 。 栈 中 这 个 表 的 下 方 是 包含 这 个 块 的 各 个 块 的 符号 
表 。 因 此 , 符号 表 可 以 按照 类 似 于 栈 的 方式 来 分 配 和 释放 。 

有 些 编译 器 维护 了 一 个 散 列表 来 存放 可 访问 的 符号 表 条 目 。 也 就 是 说 , 存放 那些 没有 被 
内 嵌 块 中 的 某 个 声明 掩盖 起 来 的 条 目 。 这 样 的 散 列 表 实 际 上 支持 常量 时 间 的 查询 ,但 是 在 进 
入 和 离开 块 时 需要 插入 和 删除 相应 的 条 目 。 在 从 一 个 块 刀 离开 时 ,编译 器 必须 撤销 所 有 因为 
B 中 的 声明 而 对 此 散 列 表 作出 的 修改 。 它 可 以 在 处 理 B 的 时 候 维护 一 个 辅助 的 栈 来 跟踪 对 这 
个 散 列表 的 所 做 的 修改 。 











语句 块 的 最 近 误 奏 (most-closely) 规 则 是 说 ,一 个 标识 符 * 在 最 近 的 x 声明 的 作用 域 中 。 也 就 
是 说 , 从 * 出 现 的 块 开始 , 从 内 向 外 检查 各 个 块 时 找到 的 第 一 个 对 * 的 声明 。 
DAI ”下列 伪 代 码 用 下 标 来 区 分 对 同一 标识 符 的 不 同 声明 


1) | int ws int y, ; 

2) {>~ int w,; bool y,; int z,; 

3) 1 
4yo 

5) Dare yi 


6) | 
下 标 并 不 是 标识 符 的 一 部 分 , 它 实际 上 是 该 标识 符 对 应 的 声明 的 行 号 。 因 此 , x 的 所 有 出 现 都 位 
于 第 1 行 上 声明 的 作用 域 中。 第 3 行 上 出 现 的 y 位 于 第 2 行 上 y 的 声明 的 作用 域 中 , 因为 y 在 内 
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层 块 中 被 再 次 声明 了 。 然 而 , 第 5 行 上 出 现 的 y 位 于 第 1 行 上 y 的 声明 的 作用 域 中 。 
假设 第 5 行 上 w 的 出 现 位 于 这 个 程序 片段 之 外 某 个 w 的 声明 的 作用 域 中 , 它 的 下 标 表 示 一 
个 全 局 的 或 者 位 于 这 个 块 之 外 的 声明 。 
最 后 , z 在 最 内 层 的 块 中 声明 并 使 用 。 它 不 能 在 第 5 行 上 使 用 ,因为 这 个 内 向 的 声明 只 能 作 
用 于 最 内 层 的 块 。 O 
SOLA RAY BT RNY, 我 们 可 以 将 符号 表 链 接 起 来 , tS A RI RS 
表 指 向 外 围 语句 块 的 符号 表 。 
图 2-36 显示 了 对 应 于 例 2.15 中 伪 代 码 的 符号 
Ko Bi 对 应 于 从 第 1 行 开始 的 语句 块 ; B 对 应 着 从 第 2 
行 开 始 的 语句 块 。 图 的 顶端 是 符号 表 Bo, 它 记录 了 全 局 
的 或 由 语言 提供 的 默认 声明 。 在 我 们 分 析 第 2 行 至 第 4 行 ”B;: 
时 , 环境 是 由 一 个 指向 最 下 层 的 符号 表 ( 即 B, 的 符号 表 ) 
的 指针 表示 的 。 当 我 们 分 析 第 5 IT, B 的 符号 表 变 得 
不 可 访问 , 环境 指针 转 而 指向 Bi 的 符号 表 , 此 时 我 们 可 图 2-36 对 应 于 例 2.15 的 符号 表 链 
以 访问 上 一 层 的 全 局 符号 表 Bo, 但 不 能 访问 B, 的 符号 表 。 E 
图 2-37 中 是 链接 符号 表 的 Java 实现 。 它 定义 了 一 个 类 Env( 环 境 “environment” 的 缩写 )9 。 
类 Env 支持 三 种 操作 : 
© 创建 一 个 新 符号 表 。 图 2-37 中 第 6 TAB 8 行 所 示 的 构造 函数 Env(p) 创 建 一 个 Env 对 
AR, 该 对 象 包含 一 个 名 为 table 的 散 列表 。 这 个 对 象 的 字段 prev 被 设置 为 参数 p, 而 
这 个 参数 的 值 是 一 个 环境 , 因此 这 个 对 象 被 链接 到 环境 。 虽然 形 成 链表 的 是 Env WH, 
但 是 将 它们 说 成 是 链接 的 符号 表 比 较 方便 。 


1) package symbols; // 文件 Env.java 
2) import java.util.*; 
3) public class Env { 

private Hashtable table; 

protected Env prev; 


public Env(Env p) { 
table = new Hashtable(); prev = p; 
} 


public void put(String s, Symbol sym) { 


table.put(s, sym); 
} 





public Symbol get(String s) { 
for( Env e = this; e != null; e = e.prev ) { 
Symbol found = (Symbol) (e.table.get(s)); 
if( found != null ) return found; 


} 


return null; 





图 2-37 类 Env 实现 了 链接 符号 表 
。 在 当前 表 中 加 入 一 个 新 的 条 目 。 散 列表 保存 了 键 - 值 对 , 其 中 
mS (key) 是 一 个 字符 串 ， 也 可 以 说 是 一 个 指向 字符 串 的 引用 。 我 们 也 可 以 使 用 指向 对 应 





O “环境 "是 另 一 个 用 于 表示 与 程序 中 某 个 点 相关 的 符号 表 集合 的 术语 。 
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于 标识 符 的 词法 单元 对 象 的 引用 作为 键 。 
m 值 (value) 是 一 个 Symbol 类 的 条 目 。 第 9 行 到 第 11 行 的 代码 不 需要 知道 一 个 条 目的 
内 部 结构 。 也 就 是 说 , 这 个 代码 是 独立 于 Symbol 类 的 字段 和 方法 的 。 
© 得 到 一 个 标识 符 的 条 目 。 它 从 当前 块 的 符号 表 开 始 搜索 链接 符号 表 。 第 12 行 至 第 18 íT 
中 这 个 操作 的 代码 返回 一 个 符号 表 条 目 或 null。 

因为 会 有 多 个 语句 块 幅 套 在 同一 外 围 语句 块 中 ,| 所 以 将 这 些 符 号 表 链 接 起 来 就 可 以 形成 一 
个 树 形 结构 。 图 2-36 中 的 虚线 提醒 我 们 链接 的 符号 表 可 以 形成 一 棵 树 。 
2.7.2 符号 表 的 使 用 

从 效果 看 ,一 个 符号 表 的 作用 是 将 信息 从 声明 的 地 方 传递 到 实际 使 用 的 地 方 。 当 分 析 标 识 
符 x 的 声明 时 , 一 个 语义 动作 将 有 关 % 的 信息 “ 放 和 人 入” 符号 表 中 。 然 后 , 一 个 像 factor id 这 样 的 
产生 式 的 相关 语义 动作 从 符号 表 中 “取出 ”这 个 标识 符 的 信息 。 因 为 对 一 个 表达 式 Ei op E (其 中 
op 代表 一 般 的 运算 符 ) 的 翻译 只 依赖 于 对 E, 和 的 翻译 , 不 直接 依赖 于 符号 表 , 所 以 我 们 可 以 
加 入 任意 数量 的 运算 符 , 而 不 会 影响 从 声明 通过 符号 表 到 达 使 用 地 点 的 基本 信息 流 。 
JERA 2-38 中 的 翻译 方案 说 明了 如 何 使 用 类 Env。 这 个 翻译 方案 主要 考虑 作用 域 、 声 明和 
使 用 。 它 实现 了 例 2. 14 中 描述 的 翻译 。 如 前 面 描 述 的 , 在 处 理 输入 

Liane es” wha (bool yy Ey 
时 , 这 个 翻译 方案 过 滤 掉 了 各 个 声明 , 并 生成 

{A kintir hoo x unt yechar; + 

请 注意 图 2-38 中 各 个 产生 式 的 体 都 已 经 对 齐 ， 因 此 所 有 的 文法 符号 出 现在 同一 列 上 ，, 并 且 
所 有 的 语义 动作 都 出 现在 第 三 列 上 。 结果 ,一 个 产生 式 体 的 各 个 组 成 部 分 常常 分 开 出 现在 多 
A } 


program => { top = null; } 
block 
block => T { saved = top; 
top = new Env(top); 
print("{ "); } 
decls stmts'}' . { top = saved; 
print("} "); } 
decis — decls decl 
[i 
decl — type id ; { s = new Symbol; 


s.type = type.lexeme; 
top.put(id.leceme, s); } 


stmts — stmts stmt 
ties 


stmt — block 
| 


factor ; {pring (3): } 
factor — id { s = top.get(id.lexeme); 
print(id.lexeme); 
print(":"); 








print(s.type);} 


Li] 





图 2-38 使 用 符号 表 翻 译 带 有 语句 块 的 语言 
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现在 考虑 语义 动作 。 这 个 翻译 方案 在 进入 和 离开 块 的 时 候 将 分 别 创建 和 释放 符号 表 ; 变量 
top 表示 一 个 符号 表 链 的 顶部 的 顶层 符号 表 。 这 个 翻译 方案 的 基础 文法 的 第 一 个 产生 式 是 pro- 
gram—blocko XE block 之 前 的 语义 动作 将 op 初始 化 为 null, 即 不 包含 任何 条 目 。 

第 二 个 产生 式 block '*'{ decls stmts'}' 中 包含 了 进入 和 离开 块 时 的 语义 动作 s。 在 进入 块 时 ， 
在 decls 之 前 , 一 个 语义 动作 使 用 局 部 变量 saved 保存 了 对 当前 符号 表 的 引用 。 这 个 产生 式 的 每 次 
使 用 都 有 一 个 单独 的 局 部 变量 saved, 这 个 变量 和 这 个 产生 式 的 其 他 使 用 中 的 局 部 变量 都 不 同 。 
在 一 个 递归 下 降 语法 分 析 器 中 ,saved 可 以 是 block 对 应 的 过 程 的 局 部 变量 。 对 于 递归 函数 中 的 局 
部 变量 的 处 理 方法 将 在 7.2 节 中 讨论 。 代 码 

top = new Env( top) ; 
将 变量 top 设置 为 刚刚 创建 的 新 符号 表 。 这 个 新 符号 表 被 链接 到 进入 这 个 块 之 前 一 刻 top 的 原 值 。 
变量 top 是 类 Env 的 一 个 对 象 , 构造 函数 Env 的 代码 显示 在 图 2-37 中 。 

在 离开 块 时 ,小 之 后 的 一 个 语义 动作 将 top 的 值 恢复 为 进入 块 时 保存 起 来 的 值 。 从 实际 效果 
看 , 这 个 表 形 成 了 一 个 栈 , 将 top 恢复 为 之 前 保存 的 值 实际 上 是 将 该 块 中 各 个 声明 的 结果 弹出 
栈 呈 。 这 样 就 使 得 该 块 中 的 声明 在 块 外 不 可 见 。 

声明 dec/ 一 tpe id 的 结果 是 创建 一 个 对 应 于 已 声明 标识 符 的 新 条 目 。 我 们 假设 词法 单元 
type 和 id 都 有 一 个 相关 的 属性 ,分 别 是 被 声明 标识 符 的 类 型 和 词素 。 我 们 不 会 讨论 符号 对 象 
的 所 有 字段 ， 但 是 我 们 假设 对 象 中 有 一 个 字段 ype 给 出 该 符号 的 类 型 。 我 们 创建 一 个 新 的 符号 
对 象 ;, 并 通过 代码 s. type = type. lexeme 为 它 赋予 正确 的 类 型 。 整个 条 目 使 用 top. put (id. lexeme, s) 
加 入 到 顶层 的 符号 表 中 。 | 

产生 式 factor->id 中 的 语义 动作 通过 符号 表 获 取 这 个 标识 符 的 条 目 。 操 作 get 从 top 开始 搜索 
符号 表 链 中 的 第 一 个 关于 此 标识 符 的 条 目 。 搜 索 得 到 的 条 目 包含 有 关 该 标识 符 的 所 有 信息 ， 比 
如 标识 符 的 类 型 。 口 


2.8 生成 中 间 代 码 


编译 器 的 前 端 构造 出 源 程序 的 中 间 表 示 ， 而 后 端 根据 这 个 中 间 表 示 生 成 目标 程序 .在 这 一 
TE, 我 们 考虑 表达 式 和 语句 的 中 间 表示 形式 , 并 给 出 一 个 如 何 生成 中 间 表 示 的 指导 性 的 例子 。 
2.8.1 两 种 中 间 表 示 形 式 

正如 我 们 在 2. 1 节 ( 特 别 是 在 图 2-4 中 ) 指 出 的 , 两 种 最 重要 的 中 间 表 示 形 式 是 : 

o 树 型 结构 , 包括 语法 分 析 树 和 (抽象 ) 语 法 树 。 

© 线性 表示 形式 , 特别 是 “三 地 址 代码 ”。 

抽象 语法 树 ( 或 简称 语法 树 ) 曾 在 2.5. 1 节 中 介绍 过 。 我 们 将 在 5.3.1 节 中 更 加 正式 地 探讨 
它 。 在 语法 分 析 过 程 中 , 将 创建 抽象 语法 树 的 结 点 来 表示 有 意义 的 程序 构造 。 随 着 分 析 的 进行 ， 
信息 以 与 结 点 相关 的 属性 的 形式 被 添加 到 这 些 结 点 上 。 选择 哪些 属性 要 依据 待 完 成 的 翻译 来 
决定 。 

为 一 方面 , 三 地 址 代码 是 一 个 由 基本 程序 步 又 ( 比如 将 两 个 值 的 相 加 ) 组 成 的 序列 。 和 树 形 结 
构 不 一 样 , 它 没有 层次 化 的 结构 。 正 如 我 们 将 在 第 9 章 中 看 到 的 那样 ， 如 果 我 们 想 对 代码 做 出 显著 
的 优化 , 就 需要 这 种 表示 形式 。 在 那 种 情况 下 , 我 们 可 以 把 组 成 程序 的 很 长 的 三 地 址 语句 序列 分 解 





O 我 们 也 可 以 使 用 男 一 种 方法 来 处 理 , 可 以 在 类 Env 中 加 入 静态 操作 push 和 pop, 而 不 用 显 式 地 保存 和 恢复 符 
SR. 
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为 “基本 块 ”。 所 谓 基本 抉 就 是 一 个 总 是 逐个 顺序 执行 的 语 名 序列, 执行 时 不 会 出 现 分 支 跳 转 。 

除了 创建 一 个 中 间 表 示 之 外 , 编译 器 前 端 还 会 检查 源 程序 是 否 遵循 源 语言 的 语法 和 语义 规 
则 。 这 种 检查 称 为 静态 检查 ( static check) “静态 ”一 般 是 指 “ 由 编译 器 完成 "2 。 静 态 检 查 确保 
一 些 特定 类 型 的 程序 错误 , 包括 类 型 不 匹配 , 能 在 编译 过 程 中 被 检测 并 报告 。 

编译 器 可 以 在 创建 抽象 语法 树 的 同时 生成 三 地 址 代码 序列 。 然 而 , 在 通常 情况 下 ,编译 器 实 
际 上 并 不 会 创建 出 存放 了 整 棵 抽象 语法 树 的 数据 结构 ,， 它 仅仅 “假装 "构造 了 一 棵 抽象 语法 树 ， 
同时 生成 三 地 址 代码 。 编 译 器 在 分 析 过 程 中 只 会 保存 将 用 于 语义 检查 或 其 他 目的 的 结 点 及 其 属 
性 , 同时 也 保存 了 用 于 语法 分 析 的 数据 结构 , 而 不 会 保存 整 棵 抽象 语法 树 。 经 过 这 样 的 处 理 , 构 
造 三 地 址 代码 时 要 使 用 到 的 那 部 分 语法 树 在 需要 时 都 是 可 用 的 , 一 旦 不 再 需要 就 会 被 释放 。 我 
们 将 在 第 5 章 详 细 讨 论 这 个 过 程 。 

2.8.2 语法 树 的 构造 

我 们 将 首先 给 出 一 个 可 以 创建 抽象 语法 树 的 翻译 方案 , 然后 在 2. 8. 4 节 中 说 明 如 何 修改 这 个 
翻译 方案 , 使 得 它 可 以 在 构造 语法 树 的 同时 生成 三 地 址 代码 , 或 者 让 它 只 生成 三 地 址 代码 。 

回顾 一 下 2.5.1 节 , 下 面 的 语法 树 

oi 

E E> 
表示 将 运算 符 op 应 用 于 El ME, 所 代表 的 子 表达 式 而 得 到 的 表达 式 。 我 们 可 以 为 任意 的 构造 创 
建 抽象 语法 树 ， 而 不 仅仅 为 表达 式 创建 语法 树 。 每 个 构造 用 一 个 结 点 表示 ， 其 子 结 点 代表 此 构造 
中 具有 语义 含义 的 组 成 部 分 。 比 如 , 在 C 语言 的 一 个 while 语句 
while ( expr ) stmt 

H, 具有 语义 含义 的 组 成 部 分 是 表达 式 expr 和 语句 stmt, XFER while 语句 的 抽象 语法 树 结 点 
有 一 个 运算 符 , 我 们 称 为 while, 并 有 两 个 子 结 点 一 一 分 别 是 expr 和 stmt 的 抽象 语法 树 。 

图 2-39 中 的 翻译 方案 为 一 个 有 代表 性 但 却 很 简单 的 由 表达 式 和 语句 组 成 的 语言 构造 出 一 棵 
语法 树 。 这 个 翻译 方案 中 的 所 有 非 终 结 符 都 有 一 个 属性 n， 即 语法 树 的 一 个 结 点 。 这 些 结 点 被 实 
现 为 类 Node 的 对 象 。 l 

类 Node 有 两 个 直接 子 类 : 一 个 是 Expr, 代表 各 种 表达 式 ; 另 一 个 是 Simt, 代表 各 种 语句 。 每 “ 
一 种 语句 都 有 一 个 对 应 的 Stm 的 子 类 。 比 如 , 运算 符 while 对 应 于 子 类 While。 一 个 对 应 于 运算 
符 while, FHRA x AI y 的 语法 树 结 点 可 以 由 如 下 伪 代 码 创 建 : 

new While(x, y) 

它 通过 调用 构造 函数 While 创建 了 类 While 的 一 个 对 象 , 其 名 称 和 类 名 相同 。 就 和 构造 函数 
对 应 于 运算 符 一 样 , 构造 函数 的 参数 对 应 于 抽象 语法 中 的 运算 分 量 。 

当 我 们 研究 附录 A 中 的 详细 代码 时 , 我 们 就 会 发 现 各 个 方法 在 这 个 类 层次 结构 中 的 位 置 。 
在 本 节 中 ,我 们 将 简单 讨论 一 下 这 些 方法 中 的 一 小 部 分 。 

我 们 将 依次 考虑 图 2-39 中 的 每 一 条 产生 式 和 规则 。 首 先 , 我 们 将 解释 定义 各 种 类 型 语句 的 
FER, 然后 再 解释 用 于 定义 有 限 几 种 表达 式 的 产生 式 。 





O 和 它 的 对 应 “动态 " 指 的 是 “ 当 程 序 运 行 时 ”。 很 多 语言 也 会 进行 某 些 动态 检查 。 比 如 , 像 Java 这 样 的 面向 对 象 语言 
有 时 必须 在 程序 执行 时 检查 类 型 ， 因 为 可 能 需要 根据 一 个 对 象 的 特定 子 类 来 决定 应 该 将 哪个 方法 应 用 于 该 对 象 。 

O 其 中 的 右 括号 的 唯一 作用 是 将 表达 式 和 语句 分 开 。 左 括号 实际 上 没有 任何 含义 ,把 它 放 在 那里 只 是 为 了 让 while 
语句 看 起 来 顺眼 一 些 , 因为 如 果 没 有 左 括号 , C 语言 中 就 会 出 现 不 匹配 的 括号 对 。 
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program — block { return block.n; } 
block — '{' stmts '} { block.n = stmts.n; } 
stmts — stmts, stmt { stmts.n = new Seq(stmts;.n, stmt.n); } 
€ { stmts.n = null; } 
stmt — expr ; { stmtn = new Eval(expr.n); } 
if ( expr) stmt, 
{ stmtn = new If(expr.n, stmt; n); } 
while ( expr ) stmt; 





{ stmt.n = new While (expr.n, stmt,.n); } 
do stmt, while ( expr); 








{ stmt.n = new Do (stmt; .n, expr.n); } 
block { stmt.n = block.n; } 
expr — rel= expr, { expr.n = new Assign (三 reln, expr, .n); } 
rel { expr.n = relin; } 
rel = rel < add { reln = new Rel ('<', reh .n, add.n); } 
| reh <= add { reln = new Rel('<', rel .n, add.n); } 
add { rel.n = add.n; } 
add 一 add; + term { add.n = new Op('+', addin, term.n); } 
| term { add.n = term.n; } 
term — term, * factor { term.n = new Op('x', termy.n, factor.n); } 
| factor { term.n = factor.n; } 
factor => ( expr) { factor.n = expr.n; } 
| num { factor.n = new Num(num.value); } 








图 2-39 为 表达 式 和 语句 构造 抽象 语法 树 

语句 的 抽象 语法 树 

我 们 在 抽象 语法 中 为 每 一 种 语句 构造 定义 了 相应 的 运算 符 。 对 于 以 关键 字 开 头 的 构造 , 我 
们 将 使 用 这 个 关键 字 作 为 对 应 的 运算 符 。 因 此 , 我 们 把 while 作为 while 语句 的 运算 符 , 而 把 do 
作为 do-while 语句 的 运算 符 。 对 于 条 件 语句 , 我 们 定义 了 两 个 运算 符 ifelse 和 让 ,分别 对 应 于 带 有 
和 不 带 有 else 部 分 的 让 语句 。 在 我 们 简单 的 示例 性 语言 中 , 我 们 没有 使 用 else, 所 以 仅 有 一 种 站 
语句 。 增 加 else 会 在 语法 分 析 过 程 中 产生 一 些 问题 。 我 们 将 在 4. 8. 2 节 中 讨论 这 些 问题 。 

每 个 语句 运算 符 都 有 一 个 对 应 的 同名 的 类 ;但 是 类 名 的 首 字符 要 大 写 。 比 如 , 类 对 应 于 
站 。 此 外 , 我 们 还 定义 了 子 类 Seq, 它 表示 一 个 语句 序列 。 这 个 子 类 对 应 于 文法 中 的 非 终结 符号 
stmiso 这 些 类 都 是 Stm WIFE, 而 Stm 又 是 Node 的 子 类 。 

图 2-39 中 的 翻译 方案 说 明了 抽象 语法 树 结 点 的 构建 方法 。 一 个 典型 的 用 于 让 语句 的 规则 如 下 : 

stmt — if( expr) stmt, | stmt.n = new If(expr. n, stmt. n); | 

站 语句 中 具有 语义 含义 的 成 分 是 expr 和 stmt, 。 语 义 动作 将 结 点 simt.n EFA If YA 
新 对 象 。 我 们 没有 给 出 矿 的 构造 函数 的 代码 。 它 创建 一 个 标号 为 ff, 子 结 点 为 expr.n 和 stmty. n 
的 新 结 点 。 

表达 式 语句 不 以 某 个 关键 字 开 头 , 所 以 我 们 定义 了 一 个 新 运算 符 eval 及 类 Eval 其 中 Eval 是 
Simi 的 一 个 子 类 ) 表 示 表 达 式 语句 。 相 关 的 规则 如 下 : 

stmt — expr; | stmt.n = new Eval(expr.n); | 
在 抽象 语法 树 中 表示 语句 块 
在 图 2-39 中 , 另 一 个 语句 构造 是 由 二 系列 语句 组 成 的 语句 块 。 考 虑 下 面 的 规则 : 
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stmt — block | stmt.n = block. n; | 

block —> stmts'}' {| block. n = stmts. n; | 
第 一 个 规则 说 明 当 一 个 语句 是 一 个 语句 块 时 ， 它 的 抽象 语法 树 和 这 个 语句 块 的 相同 ; 第 二 个 规则 
说 明 非 终结 符号 block 对 应 的 抽象 语法 树 就 是 该 块 中 的 语句 序列 对 应 的 语法 树 。 

为 简单 起 见 , 图 2-39 中 的 语言 不 包含 声明 。 虽 然 在 附录 A 中 包含 声明 ， 但 我 们 将 看 到 一 个 
语句 块 的 抽象 语法 树 仍然 就 是 块 中 的 语句 序列 的 抽象 语法 树 。 因 为 声明 中 的 信息 已 经 加 入 到 符 
Bh, 所 以 它们 不 需要 出 现在 抽象 语法 树 中 s 因此 , 不 管 它 是 否 包含 声明 ， 语句 块 在 中 间 代 码 
中 看 起 来 就 是 一 个 普通 的 语句 构造 。 

一 个 语句 序列 的 表示 方法 如 下 : 用 一 个 叶子 结 点 null 表示 一 个 空 语句 序列 ， 用 运算 符 seq 表 
示 一 个 语句 序列 。 规 则 如 下 : 

stmts —> stmts stmt | stmts.n = new Seq(stmts,.n, stmt. n); | 
DAE 在 图 2-40 中 ,我 们 可 以 看 到 表示 一 个 语句 块 或 语句 列表 的 语法 树 的 一 部 分 。 列 表 中 
有 两 个 语句 。 第 一 个 语句 是 一 个 话语 句 , 第 二 个 语句 是 while 语句 。 我 们 没有 显示 在 这 个 语句 列 
表 之 上 的 那 部 分 抽象 语法 树 , 并 且 将 各 棵 子 树 用 三 角形 表示 , 包括 这 个 语句 列表 中 对 应 于 if 语句 
和 while 语句 的 条 件 的 抽象 语法 树 , 以 及 对 应 于 这 两 个 语句 的 子 语 句 的 语法 树 。 国 


| 
seq spd aor 
> 


seq 





图 2-40 ”由 一 个 站 语句 和 一 个 while 语句 组 成 的 语 名 列表 的 语法 树 的 一 部 分 
表达 式 的 语法 树 ) 
在 以 前 的 章节 中 ; 我 们 用 三 个 非 终结 符号 ezpr、term Fl factor 使 得 乘法 * 相对 加 法 + 具有 较 
高 的 优先 级 。 我 们 在 2. 2. 6 节 中 指出 , 非 终结 符号 的 数目 正好 比 表达 式 中 优先 级 的 层 数 多 一 在 
图 2.39 中 ,我们 增添 了 两 个 同 优先 级 的 比较 运算 符 < 和 <=, 同时 也 保留 了 + 和 * 运 算 符 , 故我 


们 增加 了 一 个 新 的 非 终结 符号 cdd。 | 
抽象 语法 允许 我 们 将 “相似 的 "运算 符 分 为 一 组 , 以 减少 | 和 = pie 
在 实现 表达 式 时 需要 处 理 的 不 同情 况 和 需要 设计 的 子 类 。 在 | U ond 
本 章 中 ,“ 相 似 的 * 意 指 运算 符 的 类 型 检查 规则 和 代码 生成 规 |e t= cl 
则 相近 。 比 如 , 运算 符 + 和 ,* 通常 分 为 一 组 ， 因 为 它们 可 以 | Se Bs 
用 同一 种 方式 进行 处 理 一 -它们 对 运算 分 量 类 型 的 要 求 是 二 | */% op 
样 的 , 且 它 们 都 会 生成 一 个 将 一 个 运算 符 应 用 到 两 个 数值 之 | a Benes 
上 的 三 地 址 指令 一般 来 说 ; 在 抽象 语法 中 对 运算 符 分 组 是 | 1 access 











根据 编译 器 后 期 处 理 的 需要 来 决定 的 。 图 2-41 中 的 表 描 述 了 
几 种 常见 Java 运算 符 的 具体 语法 和 抽象 语法 之 间 的 对 应 
关系 。 

在 具体 语法 中 , 几乎 所 有 的 运算 符 都 是 左 结合 的 二 只 有 赋值 运算 符 = 是 右 结合 的 。 同 一 行 中 


2-41 几 种 常见 Java 运算 符 
的 具体 语法 和 抽象 语法 
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的 运算 符 具 有 同样 的 优先 级 , 也 就 是 说 == 和 != 具 有 同样 的 优先 级 。 各 行 是 按照 优先 级 递增 的 
方式 排列 的 , HOW == HE && 或 = 的 优先 级 更 高 。- ,wy 中 的 下 标 unary 用 于 区 分 单 目 减 号 (比如 
-2 中 的 符号 ) 和 双 目 减 号 (比如 2 -a 中 的 符号 )。 运 算 符 [] 表 示 数 组 访问 , 例如 a[i]。 

图 中 “抽象 语法 ” 列 描述 了 运算 符 的 分 组 方法 。 赋值 运算 符 = 所 在 的 组 仅 包含 它 自己 。 组 
cond 包含 了 条 件 布 尔 运算 符 && All, A rel 包含 == 和 < 所 在 行 中 的 各 个 关系 比较 运算 符 。 组 
op 包含 诸如 + 和 * 这 样 的 算术 运算 符 。 单 目 减 、 逻 辑 非 和 数组 访问 运算 符 各 自 为 一 组 。 

图 2-41 中 具体 语法 和 抽象 语法 之 间 的 映射 关系 可 以 通过 编写 翻译 方案 来 实现 。 图 2-39 中 的 

非 终 结 符号 expr、rel、add、 term 和 factor 的 产生 式 描述 了 一 些 运算 符 的 具体 语法 。 这 些 运算 符 是 
图 2-41 中 的 运算 符 的 一 个 代表 性 子 集 。 这 些 产生 式 中 的 语义 动作 创建 出 相应 的 语法 树 结 点 。 比 
如 , 规则 

term — term, * factor | term.n = new Op ('*', term,.n, factor. n); | 
创建 了 类 Op 的 结 点 ,这 个 类 实现 了 图 2-41 中 被 分 在 op 组 中 的 运算 符 。 构造 函数 Op 的 参数 中 包 
含 了 一 个 '*', 它 指明 了 实际 的 运算 符 。 它 的 参数 还 包括 对 应 于 子 表达 式 的 结 点 term1. n A fac- 
tor. No 
2.8.3 静态 检查 

静态 检查 是 指 在 编译 过 程 中 完成 的 各 种 一 致 性 检查 。 这 些 检查 不 但 可 以 确保 一 个 程序 被 顺 
利 地 编译 ,而 且 还 能 在 程序 运行 之 前 发 现 编程 错误 。 静 态 检查 包括 : 

。 语法 检查 。 语 法 要 求 比 文法 中 的 要 求 的 更 多 。 例 如 下 面 的 这 些 约束 : 任何 作用 域内 同一 

个 标识 符 最 多 只 能 声明 一 次 , 一 个 break 语句 必须 处 于 一 个 循环 或 switeh 语句 之 内 。 这 些 
约束 都 是 语法 要 求 , 但 是 它们 并 没有 包括 在 用 于 语法 分 析 的 文法 中 。 
类 型 检查 。 一 种 语言 的 类 型 规则 确保 一 个 运算 符 或 函数 被 应 用 到 类 型 和 数量 都 正确 的 运 
算 分 量 上 。 如 果 必 须要 进行 类 型 转换 ,比如 将 一 个 浮 点 数 与 一 个 整数 相 加 时 ,类 型 检查 
器 就 会 在 语法 树 中 插入 一 个 运算 符 来 表示 这 个 转换 。 下 面 我 们 将 使 用 常用 的 术语 “自动 
类 型 转换 "来 讨论 类 型 转换 的 问题 。 

左 值 和 右 值 

现在 我 们 考虑 一 些 简单 的 静态 检查 , 它们 可 以 在 源 程序 的 抽象 语法 树 构 造 过 程 中 完成 。 一 
般 来 说 , 在 进行 复杂 的 静态 检查 时 , 首先 要 生成 源 程序 的 某 个 中 间 表 示 , 然后 再 分 析 这 个 中 间 
表示 。 

赋值 表达 式 左 部 和 右 部 的 标识 符 的 含义 是 不 一 样 的 。 在 下 面 的 两 个 赋值 语句 


i= 65; 
Lie aot as 


中 , 表达 式 的 右 部 描述 了 一 个 整数 值 , 而 左 部 描述 的 是 用 来 存放 该 值 的 存储 位 置 。 术 语 左 值 (1- 
value) 和 右 值 (r-value) 分 别 表示 可 以 出 现在 赋值 表达 式 左 部 和 右 部 的 值 。 也 就 是 说 , 右 值 是 我 们 
通常 所 说 的 “ 值 ”, 而 左 值 是 存储 位 置 。 

静态 检查 要 确保 一 个 赋值 表达 式 的 左 部 表示 的 是 一 个 左 值 。 一 个 像 i 这 样 的 标识 符 是 一 个 
左 值 , 像 a[2] 这 样 的 数组 访问 也 是 左 值 , 但 2 这 样 的 常量 不 可 以 出 现在 一 个 赋值 表达 式 的 左 部 ， 
因为 它 有 一 个 右 值 ,但 不 是 左 值 。 

类 型 检查 

类 型 检查 确保 一 个 构造 的 类 型 符合 其 上 下 文 对 它 的 期 望 。 比 如 说 , A if EA 

if( expr) stmt 
中 , 期 望 表 达 式 expr 是 boolean 型 的 。 





ed 

类型 检查 规则 按照 抽象 语法 中 运算 符 / 运 算 分 量 的 结构 进行 描述 。 假设 运算 符 rel 表示 关系 
运算 符 , 如 <=。 那 么 运算 符 组 rel 的 类 型 规则 是 : 它 的 两 个 运算 分 量 必 须 具有 相同 的 类 型 ， 而 其 
结果 为 布尔 类 型 。 用 属性 type 来 表示 一 个 表达 式 的 类 型 , $ E 表示 将 rel 应 用 于 Bl M E, 的 表达 
式 。 那 么 五 的 类 型 检查 可 以 在 创建 它 对 应 的 抽象 语法 树 的 结 点 时 进行 , 执行 如 下 所 示 的 代码 
即 可 : 

if(E,. type == E. type) E. type = boolean ; 

else error ; 
即使 在 下 面 的 情况 下 , 仍 可 以 运用 将 实际 类 型 和 期 望 类 型 相 匹配 的 思想 : 

。 自动 类 型 转换 。 当 一 个 运算 分 量 的 类 型 被 自动 转换 为 运算 符 所 期 望 的 类 型 时 ,就 发 生 了 
自动 类 型 转换 (coercion) 。 在 一 个 像 2 * 3.14 这 样 的 表达 式 中 , 常见 的 转换 是 将 整数 2 
转换 为 一 个 等 值 的 浮 点 数 2.0， 然 后 对 得 到 的 两 个 浮 点 运算 分 量 执行 相应 的 浮 点 运算 。 
程序 设计 语言 的 定义 指明 了 人 允许 的 自动 类 型 转换 方式 。 比 如 ,上 面 讨论 的 rel 的 实际 规则 
可 能 是 这 样 的 ; Ej. ype Al Es. type 可 以 被 转换 成 相同 的 类 型 。 如 果 是 那样 , 把 一 个 整数 和 
一 个 浮 点 数 比较 就 是 合法 的 。 

重 载 。Java 中 的 运算 符 + 应 用 于 整数 运算 分 量 时 表示 相 加 ， 而 应 用 于 字符 串 型 运算 分 量 
时 表示 连接 。 如 果 一 个 符号 在 不 同上 下 文中 有 不 同 的 含义 ， 那么 我 们 说 这 个 符号 是 重 载 
(overloading) 的 。 因 此 ; 在 Java 中 + 是 重 载 的 。 我 们 可 以 通过 已 知 的 运算 分 量 类 型 和 结 
果 类 型 来 判断 一 个 重 载 的 运算 符 的 含义 。 比 如 , 如 果 我 们 知道 x、y 或 z 中 的 任意 一 个 是 
字符 串 类 型 , 那么 表达 式 z =x +y 中 的 运算 符 + 的 含义 就 是 连接 。 然 而 ， 如 果 我 们 还 知 
道 其 中 另 一 个 运算 分 量 是 整 型 的 , 那么 我 们 就 找到 了 一 个 类 型 错误 ，+ 的 这 次 使 用 就 没 
有 意义 。 

2.8.4 三 地 址 码 

日 抽象 语法 树 构造 完成 , 我 们 就 可 以 计算 树 中 各 结 点 的 属性 值 并 执行 各 结 点 中 的 代码 片 
段 , 进行 进一步 的 分 析 和 综合 。 我 们 将 说 明 如 何 通过 遍历 语法 树 来 生成 三 地 址 代码 。 具 体 地 说 ， 
我 们 将 显示 如 何 编写 一 个 抽象 语法 树 的 函数 ， 并 且 同 时 生成 必要 的 三 地 址 代码 。 

三 地 址 指令 

三 地 址 代码 是 由 如 下 形式 的 指令 组 成 的 序列 

x = yopz 
其 中 x、y 和 z 可 以 是 名 字 、 常量 或 由 编译 器 生成 的 临时 量 ; 而 op 表示 一 个 运算 符 。 

数组 将 由 下 面 的 两 种 变 体 指令 来 处 理 : 

aly] =z 

x=y¥lz] 

前 者 将 z 的 值 保存 到 x [y] 所 指示 的 位 置 上 , 而 后 者 则 将 y [3] 的 值 放 到 位 置 * 上 。 

三 地 址 指令 将 被 顺序 执行 , 但 是 当 遇 到 一 个 条 件 或 无 条 件 跳 转 指令 时 , 执行 过 程 就 会 跳 转 。 

我 们 选择 下 面 的 指令 来 控制 程序 流 : 


ifFalse sgotoL ”如 果 z 为 假 ， 下 一 步 执 行 标号 为 的 指令 
ifTruezgotoL ”如 果 z 为 真 ， 下 一 步 执行 标号 为 L 的 指令 
goto L 下 一 步 执 行 标号 为 L 的 指令 


在 一 个 指令 前 加 上 前 缀 荆 : 就 表示 将 标号 工 附加 到 该 指令 。 同 一 指令 可 以 同时 拥有 多 个 标号 。 
最 后 , 我 们 还 需要 一 个 拷贝 值 的 指令 。 如 下 的 三 地 址 指令 将 y 的 值 拷贝 至 x 中: 
M% 三 Y 
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语句 的 翻译 
通过 利用 跳 转 指令 实现 语句 内 部 的 控制 流 , 我 们 就 可 以 将 语句 转换 成 为 三 地 址 代码 。 图 2-42 
的 代码 布局 说 明了 对 语句 if expr then stmt, 的 翻译 。 该 代码 布局 中 的 跳 


对 expr 求 值 并 将 结 


转 指 令 果 存 放 到 z 中 的 代码 
ifFalse x goto after 
将 在 expr 的 值 为 false 时 跳 过 语句 seme, 对 应 的 翻译 结果 。 其 他 语句 的 


翻译 方法 是 类 似 的 : 我 们 将 使 用 一 些 跳 转 指令 在 其 各 个 组 成 部 分 对 应 ce 
的 代码 之 间 进 行 跳 转 。 

为 了 具体 说 明 , 我 们 在 图 2-43 中 给 出 了 类 水 的 伪 代 码 。 类 不 是 类 
Stmt 的 一 个 子 类 ,对 应 于 其 他 语句 的 类 也 是 Simz HFK, Stm 的 每 一 图 2-42 诗 语 名 的 代码 布局 
个 子 类 (这 里 是 N) 都 有 一 个 构造 函数 及 一 个 为 此 类 语句 生成 三 地 址 代码 的 函数 geno 

class If extends Stmt { 
Expr E; Stmt S; 
public If (Bwpr x, Stmt y) { E = 2; S = y; after = newlabel(); } 


public void gen() { 
Ezprn = E.rvalue(); 





emit( “ifFalse” + n.toString() + “ goto” + after); 
S.gen(); 
emit(after + “:”); 





图 2-43 类 大 中 的 函数 gen 生成 三 地 址 代码 


图 2-43 中 的 构造 函数 扩 构 建 了 让 语句 的 语法 树 结 点 。 它 有 两 个 参数 ， 一 个 表达 式 结 点 x 和 
一 个 语句 结 点 y。 它 们 被 分 别 存放 在 属性 和 5 中 。 同 时 , 这 个 构造 函数 调用 了 函数 newlable( ) , 
给 属性 after 赋予 一 个 唯一 的 新 标号 。 这 个 标号 将 按照 图 2-42 所 示 的 布局 被 使 用 。 

一 旦 源 程序 的 整个 抽象 语法 树 被 创建 完毕 ,函数 gen 在 此 抽象 语法 树 的 根 结 点 处 被 调用 。 在 
我 们 的 简单 语言 中 , 一 个 程序 就 是 一 个 语句 块 , 所 以 这 棵 抽象 语法 树 的 根 结 点 就 代表 这 个 语句 块 
中 的 语句 序列 。 所 有 的 语句 类 都 有 一 个 gen 函数 。 

图 2-43 中 类 If AY gen 函数 的 伪 代 码 具 有 代表 性 。 它 调用 E. rvalue( ) 函数 来 翻译 表达 式 E(B 
作为 寺 语 名 的 组 成 部 分 的 布尔 值 表达 式 ), 并 保存 E. rvalue( ) 返 回 的 结果 结 点 。 我 们 稍 后 会 讨论 
表达 式 的 翻译 。 然 后 ,gen 函数 发 生 一 个 条 件 跳 转 指令 , 并 且 调 用 S. gen( ) 来 翻译 子 语句 5。 

表达 式 的 翻译 

我 们 将 考虑 包含 二 目 运算 符 op、 数 组 访问 和 赋值 运算 , 并 包含 常量 及 标识 符 的 表达 式 , 以 此 
米 说 明 对 表达 式 的 翻译 。 为 了 简单 起 见 ,我们 要 求 在 数组 访问 y[z] 中 , y 必须 为 标识 符 B。 关 于 
表达 式 的 中 间 代 码 生成 的 详细 讨论 请 见 6. 4 节 。 

我 们 将 采用 一 种 简单 的 方法 ,为 一 个 表达 式 的 语法 树 中 的 每 个 运算 符 结 点 都 生成 一 个 三 
地 址 指令 。 不 需要 为 标识 符 和 常量 生成 任何 代码 , 因为 它们 可 以 作为 地 址 出 现在 指令 中 。 如 
果 一 个 结 点 < 的 类 为 Expr, 其 运算 符 为 op, 我 们 就 发 出 一 个 指令 来 计算 结 点 x 上 的 值 , 并 将 此 
值 存放 到 一 个 由 编译 器 生成 的 “临时 ”名 字 ( 比 如) 中。 因此 ,i - j +k 会 被 翻译 成 为 两 条 


ta 





O 这 个 简单 语言 支持 a[a[n]], BÆRER alm][n]. HREM, alaln] ] 是 形 如 a[] 的 访问 其 中 的 五 是 a[njo。 
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tl=i-j 
t2=ti+k 


在 处 理 数组 访问 及 赋值 运算 时 要 区 分 左 值 和 右 值 。 例 如 ,， 对 于 2 ali], 可 以 通过 计算 
a[i] 的 右 值 并 存放 在 一 个 临时 量 中 而 得 到 翻译 结果 ,如 下 所 不: 


A 
t2.= 2.* tl 


但 是 , 当 a[i] 出 现在 一 个 赋值 表达 式 的 左边 时 ,我 们 不 能 简单 地 以 一 个 临时 量 来 蔡 换 a[ i ]。 

我 们 的 简单 方法 使 用 了 两 个 函数 value 及 rvalue, 它们 分 别 显示 在 图 2-44 和 图 2-45 中 。 当 函 
数 ralue 被 应 用 于 一 个 非 叶子 结 点 x 时 , 它 生成 一 些 指令 , 这 些 指 令 对 x* 求 值 并 存放 到 一 个 临时 
量 中 , 然后 该 函数 返回 一 个 表示 此 临时 量 的 新 结 点 。 当 函数 value 被 应 用 于 一 个 非 叶 子 结 点 x 
mt, 它 也 会 生成 一 些 指令 , 这 些 指令 计算 x 之 下 的 各 个 子 树 。 然 后 这 个 函数 返回 代表 x 的 “地 址 ” 
的 新 结 点 。 

因为 函数 value 要 处 理 的 情况 相对 较 少 , 我 们 首先 对 它 进 行 描述 。 当 将 它 应 用 于 一 个 结 点 x 
时 ,如 果 此 结 点 对 应 于 一 个 标识 符 ( 即 * 的 类 是 Id), 那么 它 直 接 返 回 x。 在 我 们 的 简单 语言 中 ， 
除 此 之 外 只 存在 一 种 情况 会 使 一 个 表达 式 拥有 左 值 ， 即 结 点 x 代表 一 个 数组 访问 , 比如 a[ i]。 
在 这 种 情况 下 , 结 点 x 形 如 Access(y, z), 其 中 类 Access 是 类 Expr 的 子 类 , y 表示 被 访问 数组 的 名 
字 , 而 z 表示 被 访问 元 素 在 该 数组 中 的 偏 移 量 (下 标 )。 在 图 2-44 所 示 的 伪 代 码 中 ,函数 lvalue 会 
在 必要 时 调用 rvalue(z) 来 生成 计算 z 的 右 值 的 指令 。 然 后 它 创 建 并 返回 一 个 新 的 Access 结 点 , 此 
结 点 包含 两 个 子 结 点 , 分别 对 应 于 数组 名 y 及 z 的 右 值 。 








Expr lwalue(x : Expr) { 
if ( z 是 一 个 Id 结 点 ) return 2; 
else 这 (xz 是 一 个 4ccess (y,z) 结 点 ， 且 VY 是 一 个 14 结 点 ) { 


return new Access (y, rvalue(z)); 


else error; 





图 2-44 ”函数 lvalue 的 伪 代 码 
当 结 点 * 表示 数组 访问 a[ 2 * k] 时 ,lvalue(x) 的 调用 将 生成 指令 


t=2*k 
并 返回 一 个 表示 alt |] 的 左 值 的 新 结 点 x', 其 中 t 是 一 个 新 的 临时 名 字 。 
具体 来 说 , lvalue 函数 将 运行 到 代码 
return new Access(y, rvalue(z) ) ; 
处 , 此 时 y 是 对 应 于 a 的 结 点 , z 是 对 应 于 表达 式 2 * k 的 结 点 。 对 rvalue(x) 的 调用 生成 了 表达 
式 2*Kk 的 代码 ( 即 三 地 址 语句 上 = 2 * Kk) ,并 返回 表示 临时 名 字 上 的 新 结 点 xz。 这 个 结 点 就 成 
为 新 的 Access 结 点 x' 的 第 二 个 字段 的 值 。 图 
图 2-45 中 的 函数 rvalue 生成 指令 并 返回 一 个 (可 能 是 新 生成 的 ) 结 点 。 当 *x 代表 一 个 标识 符 
或 常量 时 , rvalue 返回 x 本 身 。 在 其 他 情况 下 , 它 都 返回 一 个 对 应 于 新 的 临时 名 字 t HY d 结 点 。 
各 种 情况 的 处 理 如 下 : 
。 如 果 结 点 x 表示 y opz, 则 代码 首先 计算 y = rzalue (y) 及 z = rvalue(z)。 它 创建 一 个 
新 的 临时 名 字 t 并 产生 一 个 指令 1 = y' opz'( 更 精确 地 说 , 生成 了 一 个 由 代表 t、y'、op 和 
z' 的 字符 串 组 合 而 成 的 指令 字符 串 )。 它 返回 一 个 对 应 于 标识 符 t 的 结 点 。 
o 如 果 结 点 x 表示 一 个 数组 访问 yLz], 我 们 可 以 复 用 函数 lvalue。 函 数 调用 lvalue(%) 返 回 一 
个 数组 访问 y[z'] ， 其 中 zx 代表 一 个 标识 符 ,， 它 保存 了 该 数组 访问 的 偏 移 量 。 函 数 rvalue 


一 个 简单 的 语法 制 旱 翻 译 器 65 





会 创建 一 个 临时 变量 t, 并 按照 ; = y[z 生成 一 个 指令 , BRNE HE 
。 如 果 % 表 示 y = 2, 那么 代码 将 首先 计算 z= rvalue\(z)。 它 生成 一 条 计算 lvalue(y) = z 
的 指令 ,并 返回 结 点 2’. 


Expr rvalue(x : Expr) { 

if («#—7 Id KF Constant 结 点 ) return z; 

else if ( zcÆ&—^ Op (op, y, z) 或 者 Rel(op,y,z) 4A) { 
t = 新 的 临时 名 字 ; 
生成 对 应 于 上 = rvalue(y) op rvalue(z) 的 指令 申 ; 
return 一 个 代表 t 的 新 结 点 ; 

} 

else if ( r #—*> Access (y, z) 结 点 ) { 
t= 新 的 临时 名 字 ; 
JAA Wwalue(x), 它 返 回 一 个 Access (y, z') WIZE FS ; 
生成 对 应 于 t = Access (y, z') HES E ; 
return 一 个 代表 上 的 新 结 点 ; 


else 证 (z 是 一 个 4ssign (y, z) 结 点 ) { 
z' = rvalue(z); 
生成 对 应 于 lvalue(y) = 2! 的 指令 串 


return 2’; 





图 2-45 pRB rvalue 的 伪 代 码 


ee 当 将 函数 rvalue 应 用 于 
ali] = 2*a[j-k] 

的 语法 树 时 , 它 将 生成 
t3 j~ k 
se ey Fe | 


ti =2 * t2 
a[i] =til 


这 棵 语法 树 的 根 是 Assign 结 点 ， 它 的 第 一 个 参数 是 a[ i ], 第 二 个 参数 是 2 * a[j -k]。 因 
此 , 适用 rvalue 函数 的 第 三 种 情况 ,函数 被 递归 地 应 用 于 2 *a[j -kx]。 这 棵 子 树 的 根 结 点 是 表 
示 * 的 0p 结 点 , 因此 malue 首先 创建 一 个 临时 变量 t1, 然后 处 理 左 运算 分 量 2, 再 后 是 右 运 算 分 
量 。 常 量 2 没有 生成 三 地 址 代码 , value 返回 它 的 右 值 , 即 一 个 值 为 2 的 Constant 结 点 。 

右 运算 分 量 a[ j -k] 是 一 个 hceess 结 点 , 因此 rvalue og: t2, 然后 在 这 个 
结 点 上 调用 lvalue PRB, ŽK rvalue 被 递归 地 调用 来 处 理 表达 式 j - 。 这 个 调用 的 副作用 是 创 
建 临 时 变量 t3, 然后 生成 三 地 址 语句 t3 =j -k。 接 着 ， em es alj- k] 
的 函数 lvalue 的 活动 中 , 临时 名 字 t2 被 赋予 整个 数组 访问 表达 式 的 右 值 , 即 t2 = a[ t3]. 

现在 , 我 们 返回 到 处 理 Op 结 点 2 * a[j =k] 的 rvalue 的 活动 中 。 这 次 调用 已 经 创建 了 临时 
变量 t1。 作 为 一 个 副作用 , rvalue 生成 了 一 条 执行 这 个 乘法 表达 式 的 三 地 址 指令 。 最 后 , 应 用 于 
整个 表达 式 的 rvalue 的 调用 活动 在 最 后 调用 lwalwe 来 处 理 左 部 af i] ,然后 生成 了 一 条 三 地 址 指 
令 a[i] =t1。 这 个 指令 把 这 个 赋值 表达 式 的 右 部 赋 给 左 部 。 O 

改进 表达 式 的 代码 

使 用 如 下 几 种 方法 ,我们 可 以 改进 图 2-45 中 的 函数 rvalue， 使 它 生成 更 少 的 三 地 址 指令 : 

。 在 之 后 的 优化 阶段 减少 拷贝 指令 的 数目 。 例如, 对 于 指令 t = 了 +1;1i Et MEt 没 

有 再 被 使 用 , 我 们 就 可 以 将 它们 合并 为 = 4 +1, 
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e 充分 考虑 上 下 文 的 情况 , 在 最 初生 成 指令 时 就 减少 生成 的 指令 。 例如 ,如果 一 个 三 地 址 
赋值 指令 的 左 部 是 一 个 数组 访问 a[t], 那么 其 右 部 必然 是 一 个 名 字 、 常 量 或 临时 变量 ， 
它们 都 只 使 用 了 一 个 地 址 。 但 如 果 左 部 是 一 个 名 字 x, 那么 其 右 部 可 以 是 一 个 使 用 两 个 
地 址 的 运算 y op zo 
我 们 可 以 按照 如 下 的 方式 来 避免 一 些 拷贝 指令 。 首 先 修改 翻译 函数 , 使 之 生成 一 个 部 分 完 
成 的 指令 , 该 指令 只 进行 计算 ,比如 计算 j +k, 但 并 不 确定 将 结果 保存 在 哪里 , 而 是 用 null OR 
代 结 果 地 址 : 
null = j +k (2.8) 
随后 , 这 个 空 的 结果 地 址 会 被 替换 为 适当 的 标识 符 或 临时 量 。 如 果 j + kx 位 于 一 个 赋值 表达 
式 的 右 部 , 如 i = j +k, 那么 null 就 会 被 替换 为 标识 符 。 此 时 (2. 8 ) 就 变 成 
Pi] ork 
但 如 果 j +k 是 一 个 子 表达 式 ， 比 如 它 在 j +K +1 中, 那么 这 个 空 的 结果 地 址 会 被 替换 成 一 
个 新 的 临时 变量 t, 并 且 生成 一 个 新 的 部 分 指令 : 


t=j+k 
null = t + 1 


很 多 编译 器 想方设法 使 得 它 生成 的 代码 和 汇编 代码 专家 手写 的 一 样 好 , 甚至 更 好 。 如 果 使 
用 第 9 章 中 讨论 的 代码 优化 技术 , 那么 一 个 有 效 的 策略 是 首先 使 用 一 个 简单 的 中 间 代 码 生成 方 
法 , 然后 依靠 代码 优化 器 来 消除 不 必要 的 指令 。 
2.8.5 2.8 节 的 练习 

练习 2. 8. 1: C 语言 和 Java 语言 中 的 for 语句 具有 如 下 形式 : 

for(expr, ; expr; exprz ) stmt 

第 一 个 表达 式 在 循环 之 前 执行 , 它 通常 被 用 来 初始 化 循环 下 标 。 第 二 个 表达 式 是 一 个 测试 ， 
它 在 循环 的 每 次 迭代 之 前 进行 。 如 果 这 个 表达 式 的 结果 变 成 0, 就 退出 循环 。 循 环 本 身 可 以 被 看 
作 语 句 | stmt expra; | 。 第 三 个 表达 式 在 每 一 次 迭代 的 末尾 执行 , 它 通常 用 来 使 循环 下 标 递 增 。 
故 for 语句 的 含义 类 似 于 

expr; ; while(expr,){ stmt expr3; | 
仿照 图 2-43 PW If, 为 for 语句 定义 一 个 类 For。 

练习 2. 8.2: 程序 设计 语言 C 中 没有 布尔 类 型 。 试 说 明 C 语言 的 编译 器 可 能 使 用 什么 方法 
将 一 个 让 语句 翻译 成 为 三 地 址 代码 。 


2.9 单 2 章 总 结 


本 章 介绍 的 语法 制导 翻译 技术 可 以 用 于 构造 如 图 2-46 所 示 的 编译 器 的 前 端 。 

。 构造 一 个 语法 制导 翻译 器 要 从 源 语言 的 文法 开始 。 一 个 文法 描述 了 程序 的 层次 结构 。 文 
法 的 定义 使 用 了 称 为 终结 符号 的 基本 符号 和 称 为 非 终 结 符号 的 变量 符号 。 这 些 符 号 代表 
了 语言 的 构造 。 一 个 文法 的 规则 , 即 产 生 式 ， 由 一 个 作为 产生 式 头 或 产生 式 左 部 的 非 终 
结 符 , 以 及 称 为 产生 式 体 或 产生 式 右 部 的 终结 符号 / 非 终结 符号 序列 组 成 。 文法 中 有 一 个 
非 终结 符 被 指派 为 开始 符号 。 

。 在 描述 一 个 翻译 器 时 , 在 程序 构造 中 附加 属性 是 非常 有 用 的 。 属 性 是 指 与 一 个 程序 构造 
关联 的 任何 量 值 。 因 为 程序 构造 是 使 用 文法 符号 来 表示 的 , 因此 属性 的 概念 也 被 扩展 到 
文法 符号 上 。 属 性 的 例子 包括 与 一 个 表示 数字 的 终结 符号 num 相关 联 的 整数 值 ， 或 与 一 
个 表示 标识 符 的 终结 符号 id 相关 联 的 字符 串 。 
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if(-peek == *\n’ ) line = line + 1; 
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(if) (() (id, "peek") (eq) (const, ’\n’) ()) 
(id, "line") (assign) (id, "line") (+) (num, 1) (;) 


i 





语法 制导 的 翻译 器 
or 
if Ts t1 = (int) +n? 
He Tes ; 2: ifFalse peek == tl goto 4 
ZN ila F line = line + 1 
peek (int) line T $ 
| \ 


*\n? line $ 
图 2-46 一 个 语句 的 两 种 可 能 的 翻译 结果 


。 词法 分 析 器 从 输入 中 逐个 读 取 字符 , 并 输出 一 个 词法 单元 的 流 , 其 中 词法 单元 由 一 个 终 
结 符号 以 及 以 属性 值 形式 出 现 的 附加 信息 组 成 。 在 图 2-46 H, 词法 单元 被 写成 用 () 括 起 
的 元 组 。 词 法 单元 (id, "peek") 由 终结 符号 id 和 一 个 指向 包含 字符 串 "peek" 的 符号 表 
条 目的 指针 构成 。 翻 译 器 使 用 符号 表 来 存放 保留 字 和 已 经 遇 到 的 标识 符 。 

© 语法 分 析 要 解决 的 问题 是 指出 如 何 从 一 个 文法 的 开始 符号 推导 出 一 个 给 定 的 终结 符号 
串 。 推 导 的 方法 是 反复 将 某 个 非 终结 符 替 换 为 它 的 某 个 产生 式 的 体 。 从 概念 上 讲 ， 语法 
分 析 器 会 创建 一 棵 语法 分 析 树 。 该 树 的 根 结 点 的 标号 为 文法 的 开始 符号 , 每 个 非 叶子 结 
点 对 应 于 一 个 产生 式 , 每 个 时 子 结 点 的 标号 为 一 个 终结 符号 或 空 串 e。 语 法 分 析 树 推导 
出 由 它 的 叶子 结 点 从 左 到 右 组 成 的 终结 符号 串 。 

。 使 用 被 称 为 预测 语法 分 析 法 的 自 顶 向 下 (从 语法 分 析 树 的 根 结 点 到 叶子 结 点 ) 方 法 可 以 手 
工 建立 高 效 的 语法 分 析 器 。 预 测 分 析 器 有 对 应 于 每 个 非 终结 符 的 子 过 程 。 该 过 程 的 过 程 
体 模拟 了 这 个 非 终结 符号 的 各 个 产生 式 。 只 要 在 输入 流 中 向 前 看 一 个 符号 , 就 可 以 无 二 
义 地 确定 该 过 程 体 中 的 控制 流 。 其 他 语法 分 析 方法 见 第 4 章 。 

。 语 法 制导 翻译 通过 在 文法 中 添加 规则 或 程序 片段 来 完成 。 在 本 章 中 , 我 们 只 考虑 了 综合 
属性 。 任 意 结 点 * 上 的 一 个 综合 属性 的 值 只 取决 于 x 的 子 结 点 (如 果 有 的 话 ) 上 的 属性 
值 。 语 法 制导 定义 将 规则 和 产生 式 相 关联 , 这些 规则 用 于 计算 属性 值 。 语 法 制导 的 翻译 
方案 在 产生 式 体 中 和 巾 和 人 了 称 为 语义 动作 的 程序 片段 。 这 些 语义 动作 按照 语法 分 析 中 产生 
式 的 使 用 顺序 执行 。 

。 语法 分 析 的 结果 是 源 代码 的 一 种 中 间 表 示 形 式 , 称 为 中 间 代码 。 图 2-46 列 出 了 中 间 代 码 
的 两 种 主要 形式 。 抽 象 语法 树 中 的 各 个 结 点 代表 了 程序 构造 , 一 个 结 点 的 子 结 点 给 出 了 
该 构造 有 意义 的 子 构造 。 另 一 种 表示 方法 是 三 地 址 代码 , 它 是 一 个 由 三 地 址 指令 组 成 的 
序列 , 其 中 每 个 指令 只 执行 一 个 运算 。 

o 符号 表 是 存放 有 关 标 识 符 的 信息 的 数据 结构 。 当 分 析 一 个 标识 符 的 声明 的 时 候 , 该 标识 
符 的 信息 被 放 入 符号 表 中 。 当 在 后 来 使 用 这 个 标识 符 时 ,比如 它 作为 一 个 表达 式 的 因子 
使 用 时 ,语义 动作 将 从 符号 表 中 获取 这 些 信息 。 
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本 音 我 们 主要 讨论 如 何 构建 一 个 词法 分 析 器 。 如 果 要 手动 地 实现 词法 分 析 器 , 首先 建立 起 
每 个 词法 单元 的 词法 结构 图 或 其 他 描述 会 有 所 帮助 。 然 后 ， 我 们 可 以 编写 代码 来 识别 输入 中 出 
现 的 每 个 词素 , 并 返回 识别 到 的 词法 单元 的 有 关 信 息 。 

我 们 也 可 以 通过 如 下 方式 自动 生成 一 个 词法 分 析 器 : 向 一 个 词法 分 析 器 生成 工具 (lexical-an- 
alyzer generator) 描述 出 词素 的 模式 ， 然 后 将 这 些 模式 编译 为 具有 词法 分 析 器 功能 的 代码 。 这 种 方 
法 使 得 修改 词法 分 析 器 的 工作 变 得 更 加 简单 , 因为 我 们 只 需 改 写 那些 受到 影响 的 模式 ,无需 改写 
整个 程序 。 这 种 方法 还 加 快 了 词法 分 析 器 的 实现 速度 , 因为 程序 员 只 需要 在 很 高 的 模式 层次 上 
描述 软件 , 就 可 以 依赖 生成 工具 来 生成 详细 的 代码 。 我 们 将 在 3.5 节 中 介绍 一 个 名 为 Lex 的 词法 
分 析 器 生成 工具 ( 它 的 一 个 最 新 的 变 体 称 为 Flex) 。 

在 介绍 词法 分 析 器 生成 工具 之 前 , 我 们 先 介绍 正则 表达 式 。 正 则 表达 式 是 一 种 可 以 很 方便 
地 描述 词素 模式 的 方法 。 我 们 将 介绍 如 何 对 正则 表达 式 进行 转换 : 首先 转换 为 不 确定 有 穷 自动 
机 ,然后 再 转换 为 确定 有 穷 自动 机 。 后 两 种 表示 方法 可 以 作为 一 个 “ 驱动 程序 ”的 输入 。 这 个 驱 
动 程序 就 是 一 段 模拟 这 些 自动 机 的 代码 , 它 使 用 这 些 自 动机 来 确定 下 一 个 词法 单元 。 这 个 驱动 
程序 以 及 对 自动 机 的 规约 形成 了 词法 分 析 器 的 核心 部 分 。 


3.1 词法 分 析 器 的 作用 


词法 分 析 是 编译 的 第 一 阶段 。 词 法 分 析 器 的 主要 任务 是 读 人 源 程序 的 输入 字符 、 将 它们 组 
成 词素 , 生成 并 输出 一 个 词法 单元 序列 , 每 个 词法 单元 对 应 于 一 个 词素 。 这 个 词法 单元 序列 被 输 
出 到 语法 分 析 器 进行 语法 分 析 。 词 法 分 析 器 通常 还 要 和 符号 表 进 行 交互 。 当 词法 分 析 器 发 现 了 
一 个 标识 符 的 词素 时 ， 它 要 将 这 个 词素 添加 到 符号 表 中 。 在 某 些 情况 下 ,词法 分 析 器 会 从 符号 表 
中 读 取 有 关 标 识 符 种 类 的 信息 ,以 确定 向 语法 分 析 器 传送 哪个 词法 单元 。 

这 种 交互 过 程 在 图 3-1 中 给 出 。 通 常 ,交互 是 由 语法 分 析 器 调用 词法 分 析 器 来 实现 的 。 图 中 
的 命令 getNextToken 所 指示 的 调用 使 得 词法 分 析 器 从 它 的 输入 中 不 断 读 取 字符 , 直到 它 识别 出 下 
一 个 词素 为 止 。 词 法 分 析 器 根据 这 个 词素 生成 下 一 个 词法 单元 并 返回 给 语法 分 析 句 。 






输出 至 语 


源 程 序 义 分 析 


getNextToken 


图 3-1 词法 分 析 器 与 语法 分 析 器 之 间 的 交互 
词法 分 析 器 在 编译 器 中 负责 读 取 源 程序 , 因此 它 还 会 完成 一 些 识别 词素 之 外 的 其 他 任务 。 


任务 之 一 是 过 滤 掉 源 程序 中 的 注释 和 空白 (空格 、 换 行 符 、 制 表 符 以 及 在 输入 中 用 于 分 隔 词法 单 
元 的 其 他 字符 ) ; 另 一 个 任务 是 将 编译 器 生成 的 错误 消息 与 源 程序 的 位 置 联系 起 来 。 例 如 , 词法 
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分 析 器 可 以 负责 记录 遇 到 的 换行 符 的 个 数 ， 以 便 给 每 个 出 错 消 息 赋予 一 个 行 号 。 在 某 些 编译 器 
H, 词法 分 析 器 会 建立 源 程序 的 一 个 拷贝 , 并 将 出 错 消息 插入 到 适当 位 置 。 如 果 源 程序 使 用 了 一 
个 宏 预 处 理 器 ; 则 宏 的 扩展 也 可 以 由 词法 分 析 器 完成 。 
有 时 , 词法 分 析 器 可 以 分 成 两 个 级 联 的 处 理 阶段 : 
1) 扫描 阶段 主要 负责 完成 一 些 不 需要 生成 词法 单元 的 简单 处 理 ， 比 如 删除 注释 和 将 多 个 连 
续 的 空白 字符 压缩 成 一 个 字符 。 
2) 词法 分 析 阶 段 是 较为 复杂 的 部 分 , 它 处 理 扫 描 阶段 的 输出 并 生成 词法 单元 。 
3. 1.1 词法 分 析 及 语法 分 析 
把 编译 过 程 的 分 析 部 分 划分 为 词法 分 析 和 语法 分 析 阶 段 有 如 下 几 个 原因 : 
1) 最 重要 的 考虑 是 简化 编译 器 的 设计 。 将 词法 分 析 和 语法 分 析 分 离 通常 使 我 们 至 少 可 以 简 
化 其 中 的 一 项 任务 。 例 如 ,如果 一 个 语法 分 析 器 必须 把 空白 符 和 注释 当 作 语 法 单元 进行 处 理 , 那 
么 它 就 会 比 那些 假设 空白 和 注释 已 经 被 词法 分 析 器 过 滤 掉 的 处 理 器 复杂 得 多 。 如 果 我 们 正在 设 
计 一 个 新 的 语言 , 将 词法 和 语法 分 开 考虑 有 助 于 我 们 得 到 一 个 更 加 清晰 的 语言 设计 方案 。 
2) 提高 编译 器 的 效率 。 把 词法 分 析 器 独立 出 来 使 我 们 能 够 使 用 专用 于 词法 分 析 任 务 、 不 进行 语法 
分 析 的 技术 。 此 外 , 我们 可 以 使 用 专门 的 用 于 读 取 输 入 字符 的 缓冲 技术 来 显著 提高 编译 器 的 速度 。 
3) 增强 编译 器 的 可 移植 性 。 输 入 设备 相关 的 特殊 性 可 以 被 限制 在 词法 分 析 器 中 。 
3.1.2 词法 单元 、 模式 和 词素 
在 讨论 词法 分 析 时 , 我 们 使 用 三 个 相关 但 有 区 别 的 术语 : 
。 词法 单元 由 一 个 词法 单元 名 和 一 个 可 选 的 属性 值 组 成 。 词 法 单元 名 是 一 个 表示 某 种 词法 
单位 的 抽象 符号 ,比如 一 个 特定 的 关键 字 , 或 者 代表 一 个 标识 符 的 输入 字符 序列 。 词 法 
单元 名 字 是 由 语法 分 析 器 处 理 的 输 大 符号 。 在 后 面 的 内 容 中 , 我 们 通常 使 用 黑体 字 给 出 
词法 单元 名 。 我 们 将 使 用 词法 单元 的 名 字 来 引用 一 个 词法 单元 。 
。 模式 描述 了 一 个 词法 单元 的 词素 可 能 具有 的 形式 。 当 词法 单元 是 一 个 关键 字 时 , 它 的 模 
式 就 是 组 成 这 个 关键 字 的 字符 序列 。 对 于 标识 符 和 其 他 词法 单元 , 模式 是 一 个 更 加 复杂 
的 结构 , 它 可 以 和 很 多 符号 串 匹配 。 
。 词素 是 源 程序 中 的 一 个 字符 序列 ， 它 和 某 个 词法 单元 的 模式 匹配 ,并 被 词法 分 析 器 识别 
为 该 词法 单元 的 一 个 实例 。 


[RE 生 图 3-2 给 出 了 一 些 常见 的 词法 单元 、 非 正式 描述 的 词法 单元 的 模式 ,并 给 出 了 _ 些 示 
例 词素 。 下 面 说 明 上 述 概念 在 实际 中 是 如 何 应 用 的 。 在 C 语句 


printf( "Total =% d\n",score); 
H, printf 和 score 都 是 和 词法 单元 id 的 模式 匹配 的 词素 , 而 “Total =% dn” 则 是 一 个 和 
literal 匹配 的 词素 。 口 
i 
非 正式 描述 
if Fai, f if 
else 字符 e, 1l, s, e else 
comparison | < 或 > 或 “= 或 >= 或 == 或 != 
字母 开头 的 字母 /数字 串 
任何 数字 常量 
在 两 个 "之 间 ， 除 " 以 外 的 任何 字符 






























二 






Pi, score, D2 
3.14159, 0, 6.02e23 
"core dumped" 






图 3-2 词法 单元 的 例子 
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在 很 多 程序 设计 语言 中 , 下 面 的 类 别 覆 盖 了 大 部 分 或 所 有 的 词法 单元 : 

1) 每 个 关键 字 有 一 个 词法 单元 。 一 个 关键 字 的 模式 就 是 该 关键 字 本 身 。 

2) 表示 运算 符 的 词法 单元 。 它 可 以 表示 单个 运算 符 , 也 可 以 像 图 32 中 的 comparison 那样 , 表示 
一 类 运算 符 。 

3) 一 个 表示 所 有 标识 符 的 词法 单元 。 

4) 一 个 或 多 个 表示 常量 的 词法 单元 ， 比 如 数字 和 字面 值 字符 串 。 

5) 每 一 个 标点 符号 有 一 个 词法 单元 ,比如 左右 括号 、 逗 号 和 分 号 。 

3.1.3 词法 单元 的 属性 

如 果 有 多 个 词素 可 以 和 一 个 模式 匹配 , 那么 词法 分 析 器 必须 向 编译 器 的 后 续 阶段 提供 有 关 
被 匹配 词素 的 附加 信息 。 例 如 , 0 和 1 都 能 和 词法 单元 number 的 模式 匹配 , 但 是 对 于 代码 生成 
器 而 言 , 至 关 重要 的 是 知道 在 源 程序 中 找到 了 哪个 词素 。 因 此 , 在 很 多 情况 下 ,词法 分 析 器 不 仅 
仅 向 语法 分 析 器 返回 一 个 词法 单元 名 字 , 还 会 返回 一 个 描述 该 词法 单元 的 词素 的 属性 值 。 词 法 
单元 的 名 字 将 影响 语法 分 析 过 程 中 的 决定 , 而 这 个 属性 则 会 影响 语法 分 析 之 后 对 这 个 词法 单元 
的 翻译 。 

我 们 假设 一 个 词法 单元 至 多 有 一 个 相关 的 属性 值 , 当然 这 个 属性 值 可 能 是 一 个 组 合 了 多 种 
信息 的 结构 化 数据 。 最 重要 的 例子 是 词法 单元 id, 我 们 通常 会 将 很 多 信息 和 它 关联 。 一 般 来 说 ， 
和 一 个 标识 符 有 关 的 信息 一 一例 如 它 的 词素 、 类 型 、 它 第 一 次 出 现 的 位 置 (在 发 出 一 个 有 关 该 标 
识 符 的 错误 消息 时 需要 使 用 这 个 信息 ) 一 一 都 保存 在 符号 表 中 。 因 此 , 一 个 标识 符 的 属性 值 是 一 
个 指向 符号 表 中 该 标识 符 对 应 条 目的 指针 。 





li EEE ET 

如 果 给 定 一 个 描述 了 某 词 法 单元 的 词素 的 模式 ,在 与 之 匹配 的 词素 出 现在 输入 中 时 识别 
出 匹配 的 词素 是 相对 简单 的 。 然 而 ,在 某 些 程序 设计 语言 中 ,要 判断 是 否 识别 到 一 个 和 某 词法 
单元 匹配 的 词素 并 不 是 一 件 轻而易举 的 事 。 下 面 的 例子 来 自 Fortran 语言 的 固定 格式 (fixed- 
format) 程序 。Fortran 90 中 仍然 支持 国定 格式 。 在 语句 

DOS I a125 
中 在 我 们 看 到 1 后 的 小 数 点 之 前 ,我 们 并 不 能 确定 D05I 是 第 -个 词素 , 即 一 个 标识 符 词法 
单元 的 实例 。 注 意 ,在 Fortran 语言 的 固定 格式 中 ,空格 是 被 忽略 的 (这 是 一 种 过 时 的 惯例 ) 
假如 我 们 看 到 的 是 一 个 逗号 ,而 不 是 小 数 点 ,那么 我 们 就 得 到 了 -个 do 语句 


po5 I =1,25 
在 这 个 语句 中 ,第 一 个 词素 是 关键 字 DO。 


URSA Fortran 语句 

E=M * C *x 2 
中 的 词法 单元 名 字 和 相关 的 属性 值 可 写成 如 下 的 名 字 - 属 性 对 序列 : 

<id, 指向 符号 表 中 EE 的 条 目的 指针 > 
<assign_op> 
<id, 指向 符号 表 中 M 的 条 目的 指针 > 
<mult_op> 
<id, 指向 符号 表 中 C 的 条 目的 指针 > 
<exp_op> 
<number, 整数 值 2> 


注意 , 在 某 些 对 中 , 特别 是 运算 符 、 标 点 符号 和 关键 字 的 对 中 , 不 需要 有 属性 值 。 在 这 个 例子 中 ， 
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词法 单元 number 有 一 个 整数 属性 值 。 在 实践 中 ,编译 器 将 保存 一 个 代表 该 常量 的 字符 串 ， 并 将 
一 个 指向 该 字符 串 的 指针 作为 number 的 属性 值 。 口 
3.1.4 词法 错误 

如 果 没 有 其 他 组 件 的 帮助 ,词法 分 析 器 很 难 发 现 源 代码 中 的 错误 。 比 如 ， 当 词法 分 析 器 在 C 
程序 片断 

fi(a== f(x)).: 
中 第 一 次 遇 到 fi 时 , 它 无 法 指出 fi 究竟 是 关键 字 if 的 误 写 还 是 一 个 未 声明 的 函数 标识 符 。 由 
于 fi 是 标识 符 id 的 一 个 合法 词素 , 因此 词法 分 析 器 必须 向 语法 分 析 器 返回 这 个 id 词法 单元 , 而 
让 编译 器 的 另 一 个 阶段 (在 这 个 例子 里 是 语法 分 析 器 ) 去 处 理 这 个 因为 字母 颠倒 而 引起 的 错误 。 

然而 , 假设 出 现 所 有 词法 单元 的 模式 都 无 法 和 剩余 输入 的 某 个 前 缀 相 匹配 的 情况 ， 此 时 词法 
分 析 器 就 不 能 继续 处 理 输入 。 当 出 现 这 种 情况 时 , 最 简单 的 错误 恢复 策略 是 “ 汐 慌 模式 ”恢复 。 
我 们 从 剩余 的 输入 中 不 断 删除 字符 , 直到 词法 分 析 器 能 够 在 剩余 输入 的 开头 发 现 一 个 正确 的 词 
法 单元 为 止 。 这 个 恢复 技术 可 能 会 给 语法 分 析 器 带 来 混乱 。 但 是 在 交互 计算 环境 中 , 这 个 技术 
已 经 足够 了 。 

可 能 采取 的 其 他 错误 恢复 动作 包括 : 

1) 从 剩余 的 输入 中 删除 一 个 字符 。 

2) 向 剩余 的 输入 中 插入 一 个 遗漏 的 字符 。 

3) 用 一 个 字符 来 替换 另 一 个 字符 。 

4) 交换 两 个 相 邻 的 字符 。 

这 些 变 换 可 以 在 试图 修复 错误 输入 时 进行 。 最 简单 的 策略 是 看 一 下 是 否 可 以 通过 一 次 变换 
将 剩余 输入 的 某 个 前 级 变 成 一 个 合法 的 词素 。 这 种 策略 还 是 有 道理 的 , 因为 在 实践 中 , 大 多 数 词 
法 错误 只 涉及 一 个 字符 。 另 外 一 种 更 加 通用 的 改正 策略 是 计算 出 最 少 需要 多 少 次 变换 才能 够 把 
一 个 源 程序 转换 成 为 一 个 只 包含 合法 词素 的 程序 。 但 是 在 实践 中 发 现 这 种 方法 的 代价 太 高 , 不 
值得 使 用 。 

3.1.5 3.1 节 的 练习 
练习 3.1. 1: 根据 3.1.2 节 中 的 讨论 , 将 下 面 的 C++ 程序 


float limitedSquare(x){float x; 
/* returns x-squared, but never more than 100 */ 
return (x<=-10.0]|x>=10.0)7100:x*x; 


} 
划分 成 正确 的 词素 序列 。 哪 些 词素 应 该 有 相关 联 的 词法 值 ? 应 应 该 具有 什么 值 ? 

练习 3. 1.2: 像 HTML 或 XML 之 类 的 标记 语言 不 同 于 传统 的 程序 设计 语言 , 它们 要 么 包含 
有 很 多 标点 符号 (标记 ), W HTML, 要 么 使 用 由 用 户 自 定义 的 标记 集合 , 如 XML。 而且 标记 还 可 
以 带 有 参数 。 请 指出 如 何 把 如 下 的 HTML 文档 


Here is a photo of <B>my house</B>; 

<P><IMG SRC = "house.gif"><BR> 

See <A HREF = "morePix.html">More Pictures</A> if you 
liked that one.<P> 


划分 成 适当 的 词素 序列 。 哪 些 词素 应 该 具有 相关 联 的 词法 值 ? 应 该 具有 什么 样 的 值 ? 
3.2 输入 缓冲 


在 讨论 如 何 识别 输入 流 中 的 词素 之 前 , 我 们 首先 讨论 几 种 可 以 加 快 源 程序 读 人 速度 的 方法 。 
源 程序 读 入 虽然 简单 却 很 重要 。 由 于 我 们 常常 需要 查看 一 个 词素 之 后 的 若干 字符 才能 够 确定 
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是 否 找到 了 正确 的 词素 , 因此 这 个 任务 变 得 有 些 困难 。 在 3:1 节 的 “识别 词法 单元 时 的 棘手 问 
题 "中 给 出 了 一 个 极端 的 例子 。 但 是 在 实践 中 , 很 多 情况 下 我 们 的 确 需要 至 少 向 前 看 一 个 字符 。 
比如 ， 我 们 只 有 读 取 到 一 个 非 字母 或 数字 的 字符 之 后 才能 确定 我 们 已 经 到 达 一 个 标识 符 的 未 尾 ， 
因此 这 个 字符 不 是 id 的 词素 的 一 部 分 a 在 C 语 言 中 , 像 -、= 或 < 这 样 的 单字 符 运算 符 也 有 可 
能 是 -> 、== 或 <= 这 样 的 双 字符 运算 符 的 开始 字符 。 因 此 ， 我 们 将 介绍 一 种 双 缓冲 区 方案 ,这 
种 方案 能 够 安全 地 处 理 向 前 看 多 个 符号 的 问题 。 然后 我 们 将 考虑 一 种 改进 方法 。 这 种 方法 使 用 
“哨兵 标记 ”来 节约 用 于 检查 缓冲 区 末端 的 时 间 。 
3.2.1. 缓冲 区 对 

由 于 在 编译 一 个 大 型 源 程序 时 需要 处 理 大 量 的 字符 ， 处 理 这 些 字符 需要 很 多 的 时 间 , 因此 开 
发 了 一 些 特殊 的 缓冲 技术 来 减少 用 于 处 理 单个 输入 字符 的 时 间 开 销 。 一 种 重要 的 机 制 就 是 利用 
两 个 交替 读 入 的 缓冲 区 , 如 图 3-3 所 示 。 









forward 
lexemeBegin 


3-3 ”使 用 一 对 输入 缓冲 区 


每 个 缓冲 区 的 容量 都 是 入 个 字符 , 通常 Y 是 一 个 磁盘 块 的 大 小 ; 如 4096 F. 我 们 可 以 使 
用 系统 读 取 命令 一 次 将 个 字符 读 人 到 缓冲 区 中 ,而 不 是 每 读 入 二 个 字符 调用 一 次 系统 读 取 命 
令 。 如 果 输 入 文件 中 的 剩余 字符 不 足 N 个 , 那么 就 会 有 一 个 特殊 字符 (用 eof 表示 ) 来 标记 源 文 
件 的 结束 。 这 个 特殊 字符 不 同 于 任何 可 能 出 现在 源 程序 中 的 字符 。 
程序 为 输入 维护 了 两 个 指针 : 

1) lexemeBegin 指针 : 该 指针 指向 当前 词素 的 开始 处 。 当前 我 们 正 试图 确定 这 个 词 
素 的 结尾 。 

2) forward 指针 : 它 一 直 向 前 扫描 , 直到 发 现 某 个 模式 被 匹配 为 止 。 做 出 这 个 决定 所 依据 
的 策略 将 在 本 章 的 其 余部 分 中 讨论 。 

一 日 确定 了 下 一 个 词素 ,forwara 指针 将 指向 该 词素 结尾 的 字符 。 词法 分 析 器 将 这 个 词素 
作为 某 个 返回 给 语法 分 析 器 的 词法 单元 的 属性 值 记录 下 来 。 然 后 使 lexemeBegin 指针 指向 刚 
刚 找到 的 词素 之 后 的 第 一 个 字符 。 在 图 3-3 中 , RNAS, forward 指针 已 经 越过 下 一 个 词素 
x» (Fortran 的 指数 运算 符 )。 在 处 理 完 这 个 词素 后 , 它 将 会 被 左 移 一 个 位 置 。 

将 forward 指针 前 移 要 求 我 们 首先 检查 是 否 已 经 到 达 某 个 缓冲 区 的 末尾 。 如 果 是 ， 我 们 必 
须 将 个 新 字符 读 到 另 一 个 缓冲 区 中 , H forward 指针 指向 这 个 新 载 人 字符 的 缓冲 区 的 头 
部 。 只 要 我 们 从 不 需要 越过 实际 的 词素 向 前 看 很 远 ， 以 至 于 这 个 词素 的 长 度 加 上 我 们 向 前 看 的 
距离 大 于 N, 我 们 就 决 不 会 在 识别 这 个 词素 之 前 覆盖 掉 这 个 尚 在 缓冲 区 中 的 词素 。 

3.2.2 哨兵 标记 

如 果 我 们 采用 上 一 节 中 描述 的 方案 , 那么 在 每 次 向 前 移动 forward 指针 时 , 我 们 都 必须 检 
查 是 否 到 达 了 缓冲 区 的 未 尾 。 若是 , 那么 我 们 必须 加 载 男 一 个 缓冲 区 。 因 此 每 读 入 一 个 字符 , 我 
们 需要 做 两 次 测试 : 一 次 是 检查 是 否 到 达 缓 冲 区 的 未 尾 , 另 一 次 是 确定 读 入 的 字符 是 什么 (后 者 
可 能 是 一 个 多 路 分 支 选择 语句 ) 。 如 果 我 们 扩展 每 个 缓冲 区 , 使 它们 在 末尾 包含 一 个 “哨兵 ” 
(sentinel) 字符 ,我 们 就 可 以 把 对 缓冲 区 末端 的 测试 和 对 当前 字符 的 测试 合 二 为 一 。 这 个 哨兵 字 
符 必须 是 一 个 不 会 在 源 程序 中 出 现 的 特殊 字符 , 一 个 自然 的 选择 就 是 字符 eof, 
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图 3-4 显示 的 缓冲 区 安排 与 图 3-3 一 致 , 只 是 加 入 了 “哨兵 标志 ”字符 。 请 注意 ,eof 仍然 可 
以 用 来 标记 整个 输入 的 结尾 。 任 何不 是 出 现在 某 个 缓冲 区 末尾 的 eof 都 表示 到 达 了 输入 的 结尾 。 
图 3.5 总 结 了 前 移 forward 指针 的 算法 。 请 注意 , 我 们 在 大 部 分 情况 下 只 需要 进行 一 次 测试 就 
可 以 根据 forward 所 指向 的 字符 完成 多 路 分 支 跳 转 。 只 有 当 我 们 确实 处 于 缓冲 区 未 尾 或 输入 末尾 
时 , 才 需 要 进行 更 多 的 测试 。 











forward 
lexemeBegin 


图 3-4 各 个 缓冲 区 末端 的 “哨兵 标记 ” 


switch ( *forward ++ ) { 
case eof: 
if (forward 在 第 一 个 缓冲 区 未 尾 ) { 
装载 第 二 个 缓冲 区 ; 
forward= 第 二 个 缓 促 区 的 开头 ; 


} 
else if (forward 在 第 二 个 缓冲 区 末尾 ) { 


装载 第 一 个 缓冲 区 ; 
forward= 第 一 个 缓冲 区 的 开头 ; 


} 
else /# 缓 冲 区 内 部 的 eof 标记 输入 结束 * / 
终止 词法 分 析 
break; 
其 他 字符 的 情况 





图 3-5 ” 带 有 哨兵 标记 的 forward 指针 移动 算法 


3. 3 词法 单元 的 规约 


正则 表达 式 是 一 种 用 来 描述 词素 模式 的 重要 表示 方法 。 虽 然 正 则 表达 式 不 能 表达 出 所 有 可 
能 的 模式 ， 但 是 它们 可 以 高 效 地 描述 在 处 理 词法 单元 时 要 用 到 的 模式 类 型 。 在 这 一 节 中 , 我 们 将 
研究 正则 表达 式 的 形式 化 表示 方法 。 在 3. 5 节 中 , 我 们 将 看 到 如 何 将 这 些 表达 式 运 用 到 词法 分 析 
器 生成 工具 中 。 然 后 , 3.7 节 显 示 了 如 何 将 正则 表达 式 转换 成 能 够 识别 所 描述 的 词法 单元 的 自动 
机 , 并 由 此 建立 一 个 词法 分 析 器 。 


我 们 会 不 会 用 完 缓冲 区 空间 ? 
在 大 多 数 现代 程序 设计 语言 中 , 词素 很 短 ,向 前 看 一 到 两 个 字符 就 能 够 确定 一 个 词素 , 所 
以 数 千 字 节 大 小 的 缓冲 区 就 已 经 足够 了 。 使 用 3.2.1 节 中 介绍 的 双 缓冲 区 方案 肯定 没 问 题 。 


但 是 仍然 存在 一 些 风险 。 比 如 ,如 果 字 符 串 包含 很 多 行 , 那么 我 们 就 有 可 能 面临 单个 词素 的 
KERN N 的 情况 。 为 了 避免 长 字符 串 引 起 的 问题 ,我 们 可 以 把 它们 看 作 不 同 组 成 部 分 的 连 
接 , 每 个 组 成 部 分 对 应 于 该 字符 串 的 一 行 。 比 如 , 在 Jaa 语言 中 , 人 们 习惯 于 将 一 个 字符 串 写 
成 多 个 部 分 , 每 个 部 分 占 一 行 , 并 在 每 个 部 分 的 结尾 加 上 运算 符 +， 将 它们 连接 起 来 。 
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当 需 要 向 前 看 任意 多 个 字符 时 ,就 会 出 现 一 个 更 加 严重 的 问题 。 比 如 , 像 PL/I 这 样 的 语 
言 没 有 将 关键 字 作 为 保留 字 来 处 理 , 也 就 是 说 , 你 可 以 使 用 一 个 和 某 个 关键 字 ( 比如 DE- 
CLARE) 同 名 的 标识 符 。 当 词法 分 析 器 处 理 以 DECLARE( ARG1 ,ARG2,…… 开 头 的 PL/I 程序 
的 文本 时 , 它 不 能 确定 DECLARE 究竟 是 一 个 关键 字 ( 此 时 后 面 的 ARG1 等 是 被 声明 的 变量 )， 
还 是 一 个 带 有 参数 的 过 程 名 。 因 为 这 个 原因 , 大 多 数 现代 程序 设计 语言 都 保留 关键 字 。 然 
而 , 如 果 不 保留 关键 字 , 我 们 可 以 把 像 DECLARE 这 样 的 关键 字 当 作 一 个 二 义 性 的 标识 符 , 由 
语法 分 析 器 来 解决 这 个 问题 。 此 时 语法 分 析 器 就 需要 在 符号 表 中 查询 有 关 信 息 。 








3.3.1 串 和 语言 

字母 表 (alphabet) 是 一 个 有 限 的 符号 集合 。 符 号 的 典型 例子 包括 字母 、 数 位 和 标点 符号 。 集 
#10, 1| 是 二 进 制 字母 表 (binary alphabet) ASCI 是 字母 表 的 一 个 重要 例子 , 它 被 用 于 很 多 软件 
系统 中 。Unicode 包含 了 大 约 100000 个 来 自 世 界 各 地 的 字符 , 它 是 字母 表 的 男 一 个 重要 例子 。 








实现 多 路 分 支 

我 们 也 许 会 认为 图 3-5 的 算法 中 的 switch 需要 执行 很 多 步 , 而 且 将 eof 分 支 放 在 开头 也 

不 是 明智 的 选择 。 但 事实 上 , 我 们 按照 什么 顺序 列 出 针对 各 个 字符 的 case 并 不 重要 。 在 实践 

中 , 可 以 用 一 个 以 字符 为 下 标的 地 址 数组 来 存放 对 应 于 各 个 case 的 指令 地 址 , 并 根据 此 数组 
中 找到 的 目标 地 址 一 次 完成 跳 转 。 








某 个 字母 表 上 的 一 个 串 (string) 是 该 字母 表 中 符号 的 一 个 有 穷 序 列 。 在 语言 理论 中 , 术语 
“句子 ”和 “ 字 ” 常 常 被 当 作 “ 串 ” 的 同义词 。 串 s 的 长 度 , 通常 记 作 1s1, 是 指 s 中 符号 出 现 的 次 数 。 
例如 ,banana 是 一 个 长 度 为 6 WH, £8 (empty string) 是 长 度 为 0 WE, He 表示。 

语言 (language) 是 某 个 给 定 字母 表 上 一 个 任意 的 可 数 的 串 集合 。 这 个 定义 非常 宽泛 。 根 据 这 
个 定义 ， 像 空 集 1 和 仅 包含 空 串 的 集合 {e} 都 是 语言 。 所 有 语法 正确 的 C 程序 的 集合 , 以 及 所 有 
语法 正确 的 英语 句子 的 集合 也 都 是 语言 ， 虽 然后 两 种 语言 难以 精确 地 描述 。 注 意 , 这 个 定义 并 没 
有 要 求 语 言 中 的 串 一 定 具有 某 种 含义 。 定 义 串 的 “含义 "的 方法 将 在 第 5 章 中 讨论 。 











串 的 各 部 分 的 术语 

下 面 是 一 些 与 串 相 关 的 常用 术语 : 

1) Bs RIITA (prefix) EM s 的 尾部 删除 0 个 或 多 个 符号 后 得 到 的 串 。 例 如 ,ban ba- 
nana #il e banana 的 前 级 。 

2) Hs Ke A (suffix) EM s 的 开始 处 删除 0 个 或 多 个 符号 后 得 到 的 串 。 例 如 , nana, 
banana 和 e 是 banana 的 后 缀 。 

3) 串 * 的 子 串 (substring) 是 删除 s 的 某 个 前 级 和 某 个 后 级 之 后 得 到 的 串 。 例 如 ,bnana、 
nan FI e 是 banana 的 子 串 。 

4) Bs WAC ue) WR, BR, RBA s 的 既 不 等 于 e, 也 不 等 于 s AMAR, 
ERTE, 

5) Œ s APF (subsequence) EM s 中 删除 0 个 或 多 个 符号 后 得 到 的 串 , 这 些 被 删除 的 
符号 可 能 不 相 邻 。 例 如 , baan 是 banana 的 一 个 子 序列 。 a 











如 果 * Fl y ER, 那么 x A y 的 连接 (concatenation)( 记 作 xy) 是 把 y 附 加 到 * 后面 而 形成 的 
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H, fil, WE xE dog Hy=house, IA xy =doghouse, 空 串 是 连接 运算 的 单位 元 ， 也 就 是 
说 ,对 于 任何 串 s 都 有 , se = es = 5. 

如 果 把 两 个 串 的 连接 看 成 是 这 两 个 串 的 “乘积 ”， 我 们 可 以 定义 串 的 “指数 "运算 如 下 : 定义 
$ He, 并 且 对 于 i>0, $ Hsls AH es =s, HERA s =s, s? =s, $ =sss, 依 此 类 推 。 
3.3.2 语言 上 的 运算 

在 词法 分 析 中 , 最 重要 的 语言 上 的 运算 是 并 、 连 接 和 闭 包 运算 。 图 3-6 给 出 了 这 些 运 算 的 正 
HEY. 并 运算 是 常见 的 集合 运算 。 语 言 的 连接 就 是 以 各 种 可 能 的 方式 ,从 第 一 个 语言 中 任 取 
一 个 串 ,， 再 从 第 二 个 语言 任 取 一 个 串 ， 然 后 将 它们 连接 后 得 到 的 所 有 串 的 集合 。 一 个 语言 二 的 
Kleene 闭 包 (closure), 记 为 L* ,就 是 将 工 连接 0 次 或 多 次 后 得 到 的 串 集 。 注 意 , Lo, BNL E 
接 0 次 得 到 的 集合 ”, 被 定义 为 |e| , 并 且 L 被 归纳 地 定义 为 LL, Ba, LEA, GAA 
L* ) 和 Kleene 闭 包 基本 相同 , 但 是 不 包含 I, REH, RIE ETFL, 和 否则 不 属于 二 。 






























LAM 的 连接 LM = {st1s 属 于 上 L 且 t AFM} 
工 的 Kleene 闭 包 ee 
LERE L* UR, L 





图 3-6 语言 上 的 运算 的 定义 
令 了 表示 字母 的 集合 1A，B，…，z，a,，D,，…，2|,， 令 D 表示 数位 的 集合 {0， 
1, …, 9} 。 我 们 可 以 用 两 种 不 同 但 等 价 的 方式 来 考虑 L 和 D。 一 种 方法 是 将 看 成 是 大 、 小 写字 
母 组 成 的 字母 表 , 将 D 看 成 是 10 个 数位 组 成 的 字母 表 。 另 一 种 方法 是 将 L 和 了 看 作 语 言 ,它们 
的 所 有 串 的 长 度 都 为 一 。 下 面 是 一 些 根据 图 3-6 中 的 运算 符 从 地 和 忆 构 造 得 到 的 新 语言 : 

1) LUD 是 字母 和 数位 的 集合 一 一 严格 地 讲 , 这 个 语言 包含 62 个 长 度 为 1 EB, 每 个 串 是 一 
个 字母 或 一 个 数位 。 

2) LD 是 包含 520 个 长 度 为 2 的 串 的 集合 , 每 个 串 都 是 一 个 字母 眼 一 个 数位 。 

3) L 是 所 有 由 四 个 字母 构成 的 串 的 集合 。 

4) L* 是 所 有 由 字母 构成 的 串 的 集合 , UAR e 

5) LCLUD) * 是 所 有 以 字母 开头 的 , 由 字母 和 数位 组 成 的 串 的 集合 。 

6) D+ 是 由 一 个 或 多 个 数位 构成 的 串 的 集合 。 

CO 
3.3.3 ”正则 表达 式 

假设 我 们 要 描述 C 语言 的 所 有 合法 标识 符 的 集合 。 它 差不多 就 是 例 3.3 的 第 5 项 所 定义 的 
语言 , 唯一 的 不 同 是 C 的 标识 符 中 可 以 包括 下 划 线 。 

在 例 3.3 中 , 我 们 可 以 首先 给 出 字母 和 数位 集合 的 名 字 , 然后 使 用 并 、 连 接 和 闭 包 这 些 运算 
符 来 描述 标识 符 。 这 种 处 理 方法 非常 有 用 。 因 此 ,人 们 常常 使 用 一 种 称 为 正则 表达 式 的 表示 方 
法 来 描述 语言 。 正 则 表达 式 可 以 描述 所 有 通过 对 某 个 字母 表 上 的 符号 应 用 这 些 运算 符 而 得 到 的 
语言 。 在 这 种 表示 法 中 , 如 果 使 用 letter 来 表示 任 一 字母 或 下 划 线 , 用 digit_ 来 表示 数位 , W 
么 可 以 使 用 如 下 的 正则 表达 式 来 描述 对 应 于 C 语言 标识 符 的 语言 : 

letter _( letter _|\ digit) * 
上 式 中 的 竖 线 表示 并 运算 , 括号 用 于 把 子 表达 式 组 合 在 一 起 , 星 号 表示 “ 零 个 或 多 个 "括号 中 表 
达 式 的 连接 , 将 letter _ 和 表达 式 的 其 余部 分 并 列表 示 连 接 运算 。 
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正则 表达 式 可 以 由 较 小 的 正则 表达 式 按照 如 下 规则 递归 地 构建 。 每 个 正则 表达 式 ”表示 一 
个 语言 L(r), 这 个 语言 也 是 根据 的 子 表达 式 所 表示 的 语言 递归 地 定义 的 。 下 面 的 规则 定义 了 某 
个 字母 表 呈 上 的 正则 表达 式 以 及 这 些 表达 式 所 表示 的 语言 。 

归纳 基础 : 如 下 两 个 规则 构成 了 归纳 基础 : 
1) e 是 一 个 正则 表达 式 , L(e) = |e}, 即 该 语言 只 包含 空 串 。 
2) 如 果 是 史上 的 一 个 符号 , 那么 a 是 一 个 正则 表达 式 , IFA Lla) = ia}。 也 就 是 说 ; 这 个 语 
言 仅 包含 一 个 长 度 为 1 的 符号 串 a。 请 注意 , 根据 惯例 ， 我 们 通常 用 斜体 表示 符号 , 粗 体 表示 它 
们 所 对 应 的 正则 表达 式 。9 

归纳 步骤 : 由 小 的 正则 表达 式 构造 较 大 的 正则 表达 式 的 步骤 有 四 个 部 分 。 假 定 r 和 s 都 是 正 
则 表达 式 , DIERA A Lr) M LCs), ABA: 

1) (r)1 (s) 是 一 个 正则 表达 式 , 表示 语言 L(r) UL(s)。 

2) (r) (s) 是 一 个 正则 表达 式 , 表示 语言 L(7)L(s)。 

3) (r)* 是 一 个 正则 表达 式 , 表示 语言 (L(7r))”。 

4) (7) 是 一 个 正则 表达 式 , 表示 语言 L(7)。 最 后 这 个 规则 是 说 在 表达 式 的 两 边 加 上 括号 并 
不 影响 表达 式 所 表示 的 语言 。 

按照 上 面 的 定义 , 正则 表达 式 经 常会 包含 一 些 不 必要 的 括号 。 如 果 我 们 采用 如 下 的 约定 , 就 
可 以 丢掉 一 些 括号 : 

1) 一 元 运算 符 * 具有 最 高 的 优先 级 , 并 且 是 左 结合 的 。 

2) 连接 具有 次 高 的 优先 级 , 它 也 是 左 结 合 的 。 

3) 【的 优先 级 最 低 , 并且 也 是 左 结合 的 。 

例如 , 我 们 可 以 根据 这 个 约定 将 (a)1((b)* (ec) ) 改 写 为 alb*c。 这 两 个 表达 式 都 表示 同样 
的 串 集合 , 其 中 的 元 素 要 么 是 单个 a, 要 么 是 由 0 个 或 多 个 b 后 面 再 跟 一 个 组 成 的 串 。 
UREI 2 >= 1a, bl, 

1) 正则 表达 式 alb 表示 语言 {a, b}o 

2) 正则 表达 式 (alb) (alb) MIA laa, ab, ba, bb}, MHEFHRRS LKEA2 WHA 
的 集合 。 可 表示 同样 语言 的 另 一 个 正则 表达 式 是 aalablbalbb。 

3) 正则 表达 式 a* 表示 所 有 由 零 个 或 多 个 a 组 成 的 串 的 集合 , Mie, a, aa, aaa, =} o 

4) 正则 表达 式 (alb)* 表示 由 零 个 或 多 个 a 或 8 的 实例 构成 的 串 的 集合 , 即 由 a 和 4 构成 的 
FEBRES |e, a, b, aa, ab, ba, bb, aaa, …1|。 另 一 个 表示 相同 语言 的 正则 表达 式 是 
(a hb” )”s 

5) 正则 表达 式 ala*b 表示 语言 (a, b, ab, aab, aaab, =}, 也 就 是 串 a MA b 结尾 的 零 个 或 
多 个 a 组 成 的 串 的 集合 。 Oo 

可 以 用 一 个 正则 表达 式 定义 的 语言 叫做 正则 集合 (regular set)。 如 果 两 个 正则 表达 式 r+ 和 s 
表示 同样 的 语言 , 则 称 r 和 s 等 价 (equivalent) , 记 作 7=s。 例 如 , (alb) = (bla)。 正 则 表达 式 遵 
守 一 些 代 数 定律 , 每 个 定律 都 断言 两 个 具有 不 同形 式 的 表达 式 等 价 。 图 3-7 给 出 了 一 些 对 于 任意 
正则 表达 式 r、s 和 + 都 成 立 的 代数 定律 。 


© Am, 当 讨 论 ASCH 字符 集中 的 特定 字符 时 , 我 们 通常 将 使 用 电 传 字体 同时 表示 字符 和 它 的 正则 表达 式 。 
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图 3-7 正则 表达 式 的 代数 定律 















3. 3.4 正则 定义 
为 方便 表示 , 我 们 可 能 希望 给 某 些 正则 表达 式 命名 ， 并 在 之 后 的 正则 表达 式 中 像 使 用 符号 一 
样 使 用 这 些 名 字 。 如 果 5 是 基本 符号 的 集合 ， 那么 一 个 正则 定义 (regular definition) 是 具有 如 下 
形式 的 定义 序列 : 
d,—1, 


d,— ry 


dy> r, 


其 中 : 

。 每 个 di 都 是 一 个 新 符号 , 它们 都 不 在 王 中 ,并 且 各 不 相同 。 

。 每 个 是 字母 表 3U Id, d, e, d;_1| 止 的 正则 表达 式 。 

我 们 限制 每 个 中 只 含有 马 中 的 符号 和 在 它 之 前 定义 的 各 个 d, 因此 避免 了 递归 定义 的 问 
是 ,并 且 我 们 可 以 为 每 个 7; 构造 出 只 包含 号 中 符号 的 正则 表达 式 ;我 们 可 以 首先 将 n 它 不 能 使 
FA di 之 外 的 任何 d) 中 的 di BER ri, REREH 中 的 di 和 由 替换 为 m 和 (将 换 之 后 的 )1， 
依 此 类 推 。 最 后 ,我们 将 7 中 的 di(i=1, 2,…, n -1) 兰 换 为 ;的 经 营 换 后 的 版 本 ,在 这 些 版 术 
中 都 只 包含 号 中 的 符号 。 
(513.5 | 《语言 的 标识 符 是 由 字母 数字 和 下 划 线 组 成 的 串 。 下 面 是 C 标识 符 对 应 的 语言 的 一 
个 正则 定义 。 我 们 将 按照 惯例 用 斜体 字 来 表示 正则 定义 中 定义 的 符号 ， 

letter. — A | B | | 世 | al bl lz] 


digit 0| 11-19 
id — letter- ( letter. | digit D 


O 
(《 整 型 或 浮 点 型 ) 无 符号 数 是 形 如 5280、0.01234 、6.336B4 或 1.89E -4 的 串 。 下 
面 的 正则 定义 给 出 了 这 类 符号 串 的 精确 规约 


digit + O|1|---|9 
digits > digit digit* 
optionalFraction — . digits | e 
optionalExponent 一 (E(+|-|€) digits ) Je 
number — digits optionalFraction optionalExponent 
在 这 个 定义 中 ， optionallraction A525 8, 要 么 是 小 数 点 后 再 跟 一 个 或 多 个 数位 optiona. 
[Exponent 如 果 不 是 空 串 ， 就 是 字母 EE 后 跟随 一 个 可 选 的 + 号 或 -号 ， 再 跟 上 一 个 或 多 个 数位 。 请 
注意 , 小 数 点 后 至 少 要 跟 一 个 数位 ， 所 以 number 和 1. 不 匹配 , 但 和 1.0 匹配 。 O 


ee Sy en 
3.3.5 正则 表达 式 的 扩展 

自从 Kleene 在 20 世纪 50 年 代 提出 了 带 有 基本 运算 符 并 、 连 接 和 Kleene 闭 包 的 正则 表达 式 
之 后 , 已 经 出 现 了 很 多 种 针对 正则 表达 式 的 扩展 , 它们 被 用 来 增强 正则 表达 式 描述 串 模式 的 能 
力 。 在 这 里 ,我 们 介绍 的 一 些 最 早出 现在 像 Lex 这 样 的 Unix 实用 程序 中 的 扩展 表示 法 。 这 些 扩 
展 表示 法 在 词法 分 析 器 的 规约 中 非常 有 用 。 本 章 的 参考 文献 中 包含 了 一 个 对 当今 仍 在 使 用 的 正 
则 表达 式 变 体 的 讨论 。 

1) 一 个 或 多 个 实例 。 单 目 后 缀 运算 符 + 表示 一 个 正则 表达 式 及 其 语言 的 正 闭 包 。 也 就 是 
说 , 如 果 7 是 一 个 正则 表达 式 , 那么 (r) + 就 表示 语言 (L(r) ) * 。 运 算 符 + 和 运算 符 * 具有 同样 的 
优先 级 和 结合 性 。 两 个 有 用 的 代数 定律 r* =r* le 和 r* =rr”=r*r 说 明了 Kleene 闭 包 * AMER 
包 之 间 的 关系 。 

2) 零 个 或 一 个 实例 。 单 目 后 级 运算 符 ? 的 意思 是 “ 零 个 或 一 个 出 现 ”。 也 就 是 说 , r? 等 价 于 
rle, 换 句 话说 , LOD = L(r) Ute! 。 运 算 符 ? SEAR + 和 运算 符 * 具有 同样 的 优先 级 和 结合 
性 。 

3) 字符 类 。 一 个 正则 表达 式 a lal la, (其 中 a; 是 字母 表 中 的 各 个 符号 ) 可 以 缩写 为 
[ajay a] EEEE, 当 a1, a i, a, 形成 一 个 逻辑 上 连续 的 序列 时 ， 比 如 连续 的 大 写字 
E 小 写字 母 或 数位 时 , 我们 可 以 把 它们 表示 成 a1 - av。 也 就 是 说 ,只 写 出 第 一 个 和 最 后 一 个 符 
号 ,中间 用 连词 符 隔 开 。 因 此 , [abe] 是 alble 的 缩写 , [a -z] 是 alb1…1z 的 缩写 。 

DE 根据 这 些 缩写 表示 法 , 我 们 可 以 将 例 3.5 中 的 正则 定义 改写 为 ， 


letter. — [A-Za-z_] 
digit — [0-9] 
id — letter- ( letter- | digit )* 


例 3.6 的 正则 定义 可 以 简化 为 : 
digit = [0-9] 
digits —+ “digitt 
number — digits (. digits)? ( E [+-]? digits )? oO 

3.3.6 3.3 节 的 练习 

练习 3. 3.1; 对 于 下 列 各 个 语言 , 查询 语言 使 用 手册 以 确定 : (i) 形 成 各 语言 的 输入 字母 表 的 
字符 集 分 别 是 什么 (不 包括 那些 只 能 出 现在 字符 串 或 注释 中 的 字符 )? (ii) 各 语言 的 数字 常量 的 
词法 形式 是 什么 ?〈 这 ) 各 语言 的 标识 符 的 词法 形式 是 什么 ? 

(1) C (2) C++ (3) C# (4) Fortran (5) Java (6) Lisp (7) SQL 

| 练习 3. 3.2: 试 描述 下 列 正则 表达 式 定义 的 语言 : 

1) a(alb)*a 

2) ((ela)b* )* 

3) (alb)* a(alb) (alb) 

4) a* ba* ba* ba* 

1! 5) (aalbb)* ( (abl ba) (aal bb) * (ab! ba) (aalbb)* )* 

练习 3.3.3: 试 说 明 在 一 个 长 度 为 n 的 字符 串 中 , 分 别 有 和 多 少 个 

1) 前 绥 

2) aR 

3) 真 前 绥 

14) FẸ 
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15) FPA 

$5) 3.3.4: 很 多 语言 都 是 大 小 写 敏感 的 (case sensitive) ; 因此 这 些 语言 的 关键 字 只 能 有 一 种 写 
法 ,描述 这 些 关 键 字 的 词素 的 正则 表达 式 就 很 简单 。 但 是 ; 像 SQL 这 样 的 语言 是 大 小 写 不 敏感 的 
(case insensitive), 一 个 关键 字 既 可 以 大 写 , 也 可 以 小 写 , 还 可 以 大 小 写 混 用 。 因 此 , SQL 中 的 关键 
F SELECT 可 以 写成 select、Select 或 sBlEcT。 请 描述 出 如 何 用 正则 表达 式 来 表示 大 小 写 不 
敏感 的 语言 中 的 关键 字 。 给 出 描述 SQL 语言 中 的 关键 字 “select” 的 表达 式 , 以 说 明 你 的 思想 。 

! 练习 3. 3.5: 试 写 出 下 列 语言 的 正则 定义 : 

1) 包含 5 个 元 音 的 所 有 小 写字 母 串 , 这 些 串 中 的 元 音 按 顺序 出 现 。 

2) 所 有 由 按 词典 递增 序 排列 的 小 写字 母 组 成 的 串 。 

3) TER, BI s A ZR, 且 串 中 没有 不 在 双 引 号 (") 中 的 * /。 

114) 所 有 不 重复 的 数位 组 成 的 串 。 提 示 : 首先 尝试 解决 只 含有 少量 数位 (比如 10, 1, 21) 
的 数位 串 。 

115) 所 有 最 多 只 有 一 个 重复 数位 的 串 。 

116) 所 有 由 偶数 个 a 和 奇数 个 构成 的 串 。 

7) 以 非 正式 方式 表示 的 国际 象棋 的 步 法 的 集合 , 如 p - k4 或 kbp x qn。 

118) 所 有 由 a 和 4。 组 成 上 且 不 含 子 串 abb 的 串 。 

9) 所 有 由 a Alb MAAS FPS abb 的 串 。 

练习 3. 3. 6: 为 下 列 的 字符 集合 写 出 对 应 的 字符 类 。 

1) 英文 字母 的 前 10 个 字母 (从 a ~j), 包括 大 写 和 小 写 。 

2) 所 有 小 写 的 辅音 字母 的 集合 。 

3) 十 六 进 制 中 的 “数位 (对 大 于 9 的 数位 ， 自 己 决 定 大 写 或 小 写 ) 。 

4) 可 以 出 现在 一 个 合法 的 英语 句子 后 面 的 字符 集 ( 比如 感叹 号 ) 。 

从 下 面 开始 直到 练习 3.3;10( 含 ) 讨 论 了 来 自 Lex 的 正则 表达 式 的 扩展 表示 方法 (我 们 将 在 
3.5 节 中 讨论 这 个 词法 分 析 器 生成 工具 ) 。 这 些 扩展 表示 方法 在 图 3.8 中 列 出 。 


单个 非 运 算 符 字符 e 

字符 c 的 字面 值 

串 s 的 字面 值 

除 换行 符 以 外 的 任何 字符 
一 行 的 开始 

行 的 结尾 

FER s 中 的 任何 一 个 字符 

WER s 中 的 任何 一 个 字符 

和 了 匹配 的 零 个 或 多 个 串 连 接 成 的 串 
和 7 匹配 的 一 个 或 多 个 串 连 接 成 的 串 
零 个 或 一 个 7 

最 少 m 个 ， 最 多 nl 个 7 的 重复 出 现 
ri JEME r2 

1 或 72 

与 7 相同 

后 面 跟 有 r2 时 的 六 











图 3-8 Lex 的 正则 表达 式 
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练习 3.3.7: 请 注意 这 些 正 则 表达 式 中 的 下 列 字符 ( 称 为 运算 符 字符 ) 都 具有 特殊 的 含义 : 
Un Longe fer po em 

如 果 想 要 使 得 这 些 特殊 字符 在 一 个 串 中 表示 它们 自身 , 就 必须 取消 它们 的 特殊 含义 。 我 们 
将 它们 放 在 二 个 长 度 大 于 等 于 1 且 加 上 双 引 号 的 串 中 就 可 以 取消 特殊 合 义 。 例如 , 正则 表达 式 
“ee PIE ee 匹配 。 我 们 也 可 以 在 一 个 运算 符 字符 前 加 一 个 反 斜 线 , 得 到 这 个 字符 的 字面 
APL, WGA, 正则 表达 式 \x \* 也 和 囊 ** 匹配 。 请 写 出 一 个 和 字符 串 " \ 匹 配 的 正则 表达 式 。 

练习 3.3.8: 在 Lex 中, 补 集 字 符 类 (complemented character class) 代表 该 字符 类 中 列 出 的 字 
符 之 外 的 所 有 字符 。 我 们 将 * 放 在 开头 来 表示 一 个 补 集 字符 类 。 除 非 “在 该 字符 类 内 列 出 , 否则 这 
个 字符 不 在 被 取 补 的 字符 类 中 。 因 此 , [A -za -zj 匹配 所 有 不 是 大 小 写字 母 的 字符 , [r] 
配 除 *( 以 及 换行 符 , 因为 它 不 在 任何 字符 类 中 ) 之 外 的 任何 字符 。 试 证 明 : 对 于 每 个 带 有 补 集 字 
符 类 的 正则 表达 式 , 都 存在 一 个 等 价 的 不 含 补 集 字符 类 的 正则 表达 式 。 

| 练习 3. 3. 9: 正则 表达 式 | m, n) 和 模式 r 的 m 到 nn 次 重复 出 现 相 匹配 。 例 如 , all, 5} 和 
由 1~5 个 a 组 成 的 串 匹 配 。 试 证 明 : 对 于 每 一 个 包含 这 种 形式 的 重复 运算 符 的 正则 表达 式 , 都 
存在 一 个 等 价 的 不 包含 重复 运算 符 的 正则 表达 式 。 

| 练习 3. 3. 10: 运算 符 ` 匹 配 一行 的 最 左 端 , $ 匹 配 一 行 的 最 右 端 。 运 算 符 “也 被 用 作 补 集 字符 
类 的 首 字符 , 但 是 通过 上 下 文 总 是 能 够 确定 它 的 含义 。 例 如 ，“[ “aeiou]*$ 匹 配 任何 一 个 不 包 
含 小 写 元 音字 符 的 行 。 

1) 你 怎样 判断 “到 底 表 示 哪 一 个 意思 ? 

2) 是 否 总 是 能 够 将 一 个 包括 "和 $ 运 算 符 的 正则 表达 式 蔡 换 为 一 个 等 价 的 不 包含 这 些 运算 符 
的 正则 表达 式 ? 

| 练习 3. 3. 11: UNIX 的 shell 命令 sh 在 文件 名 表达 式 中 使 用 图 3-9 中 的 运算 符 来 描述 文件 名 
的 集合 。 例 如 , 文件 名 表达 式 *.o 和 所 有 以 .o 结束 的 文件 名 匹配 ; sort1.? 和 所 有 形 如 
sort1.c 的 文件 名 匹配 , 其 中 < 可 以 是 任何 字符 。 试 问 如 何 使 用 只 包含 并 、 连 接 和 闭 包 运算 符 的 
正则 表达 式 来 表示 sh 文件 名 表达 式 ? 


*,O 
sorti.? 


s 中 的 确 任何 字符 sort1. [cso] 





图 3-9 shell 命令 sh 使 用 的 文件 名 表达 式 


! 练习 3. 3. 12 : SQL 语言 支持 一 种 不 成 熟 的 模式 描述 方式 , 其 中 有 两 个 具有 特殊 含义 的 字 
符 ; 下 划 线 ( _ ) 表 示 任 意 一 个 字符 ; 百 分 号 % 表示 包含 0 个 或 多 个 字符 的 串 。 此 外 ,程序 员 还 可 
以 将 任意 一 个 字符 (比如 e) 定 义 为 转 义 字符 。 那 么 ,在 _、% 或 者 另 一 个 。 之 前 加 上 一 个 。，, 就 使 得 
这 个 字符 只 表示 它 的 字面 值 。 假 设 我 们 已 经 知道 哪个 字符 是 转 义 字符 ; 说 明 如 何 将 任意 SQL 模 
式 表示 为 一 个 正则 表达 式 。 


3.4 词法 单元 的 识别 


上 一 节 介绍 了 如 何 使 用 正则 表达 式 来 表示 一 个 模式 。 现 在 , 我 们 必须 学 习 如 何 根据 各 个 需 
要 识别 的 词法 单元 的 模式 来 构造 出 一 段 代码 。 这 有 段 代码 能 够 检查 输入 字符 串 , 并 在 输入 的 前 组 
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中 找 出 一 个 和 某 个 模式 匹配 的 词素 。 我 们 的 讨论 将 围绕 下 面 的 例子 展开 。 
DEE asio 的 文法 片段 描述 了 分 支 语句 和 条 件 表达 式 的 一 种 简单 形式 。 这 个 语法 和 Pascal 
语言 的 语法 类 似 , 它 的 then 关键 字 显 式 地 出 现在 条 件 表达 式 的 后 面 。 对 于 relop, 我 们 使 用 Pas- 
cal 或 SQL 语言 中 的 比较 运算 符 ,其 中 = 表示 “相等 "，< > 表示 “不 相等 ”, 因为 它们 呈现 了 一 种 
有 意思 的 词素 结构 。 

在 考虑 词法 分 析 器 时 , 文法 的 终结 符号 , 包括 这、then、else、relop、id 及 number, 都 是 词法 
单元 的 名 字 。 这 些 词法 单元 的 模式 使 用 图 3-11 中 的 正则 定义 来 描述 。 其 中 这 和 number 的 模式 和 
我 们 之 前 在 例 3.7 中 看 到 的 模式 类 似 。 


[o-9} 
digitt 

digits (. digits)? (E [+-]? digits )? 
[A-Za-z] 

letter ( letter | digit )* 

if 

then 

else 

<|> [<= [>=] =| <> 


if expr then stmt 
if expr then stmt else stmt 


€ 
term relop term 


term 
id 
number 


一 
一 
一 
一 
一 》 
一 
=> 
+ 
一 








3-10 分 支 语句 的 文法 图 3-11， 例 3.8 中 词法 单元 的 模式 


对 这 个 语言 , 词法 分 析 器 将 识别 关键 字 if then, else 以 及 和 relop, id 和 num 的 模式 匹配 的 词 
素 。 为 了 简化 问题 , 我 们 做 出 如 下 的 常见 假设 : 关键 字 也 是 保留 字 。 也 就 是 说 , 它们 不 是 标识 
符 , 虽然 它们 的 词素 和 标识 符 的 模式 匹配 。 

此 外 , 我们 还 让 词法 分 析 器 负责 消除 空白 符 , 方法 是 让 它 识别 如 下 定义 的 “词法 单元 ”ws。 

ws > ( blank | tab | newline )+ 

这 里 , blank, tab 及 newline 是 用 于 表示 具有 同样 名 字 的 ASCI 字符 的 抽象 符号 。 词 法 单元 
ws 同 其 他 的 词法 单元 的 不 同 之 处 在 于 : 当 我 们 识别 到 ws 时 , 我 们 并 不 将 它 返回 给 语法 分 析 器 ， 
而 是 从 这 个 空白 之 后 的 字符 开始 继续 进行 词法 分 析 。 返 回 给 语法 分 析 器 的 是 下 一 个 词法 单元 。 

图 3-12 总 结 了 词法 分 析 器 的 目标 。 对 于 各 个 词素 或 词素 的 集合 , 该 表 显 示 了 应 该 将 哪个 词 
法 单元 名 返回 给 语法 分 析 器 ， 以 及 按照 3.1.3 节 中 的 介绍 , 应 该 返回 什么 属性 值 。 请 注意 , 对 于 
其 中 的 6 个 关系 运算 符 , 符号 常量 LT、LE 等 被 当 作 属 性 值 返回 , 其 目的 是 指明 我 们 发 现 的 是 词 
法 单元 relop 的 哪个 实例 。 找 到 的 运算 符 将 影响 编译 器 输出 的 代码 。 E 


kw 


指向 符号 表 条 目的 指针 


指向 符号 表 条 目的 指针 


<> 





>= 


图 3-12 词法 单元 \ 它 们 的 模式 以 及 属性 值 


82 73 # 





3.4.1 状态 转换 图 

作为 构造 词法 分 析 器 的 一 个 中 间 步骤 ,我 们 首先 将 模式 转换 成 具有 特定 风格 的 流 图 , 称 为 
“状态 转换 图 " 。 在 本 节 中 , 我 们 用 手工 方式 将 正则 表达 式 表示 的 模式 转化 为 状态 转换 图 , 在 3.6 
节 中 ， 我 们 将 看 到 可 以 使 用 自动 化 的 方法 根据 一 组 正则 表达 式 集合 构造 出 状态 转换 图 。 

状态 转换 图 (transition diagram) 有 一 组 被 称 为 “状态 ”( state ) 的 结 点 或 圆圈 。 词 法 分 析 器 在 扫 
描 输入 串 的 过 程 中 寻找 和 某 个 模式 匹配 的 词素 , 而 转换 图 中 的 每 个 状态 代表 一 个 可 能 在 这 个 过 
程 中 出 现 的 情况 。 我 们 可 以 将 一 个 状态 看 作 是 对 我 们 已 经 看 到 的 位 于 lexemeBegin 指针 和 forward 
指针 之 间 的 字符 的 总 结 , 它 包含 了 我 们 在 进行 词法 分 析 时 需要 的 全 部 信息 5 

状态 图 中 的 边 (edge) 从 图 的 一 个 状态 指向 另 一 个 状态 。 每 条 边 的 标号 包含 了 一 个 或 多 
个 符号 。 如 果 我 们 处 于 某 个 状态 s, 并 且 下 一 个 输入 符号 是 a, 我 们 就 会 寻找 一 条 从 离开 
且 标 号 为 4 的 边 (该 边 的 标号 中 可 能 还 包括 其 他 符号 ) 。 如 果 我 们 找到 了 这 样 的 一 条 边 ， 就 
Hi forward 指针 前 移 ,并 进入 状态 转换 图 中 该 边 所 指 的 状态 。 我 们 假设 所 有 状态 转换 图 都 是 
确定 的 ,这 意味 着 对 于 任何 一 个 给 定 的 状态 和 任何 一 个 给 定 的 符号 , 最 多 只 有 一 条 从 该 状 
态 离开 的 边 的 标号 包含 该 符号 。 从 3. 5 节 开 始 , 我 们 将 放松 对 确定 性 的 要 求 , 令 词 法 分 析 
器 的 设计 者 更 加 容易 完成 任务 , 但 同时 提高 了 对 实现 者 的 技巧 要 求 。 一 些 关于 状态 转换 图 
的 重要 约定 如 下 : 

1) 某 些 状态 称 为 接受 状态 或 最 终 状态 。 这 些 状态 表明 已 经 找到 了 一 个 词素 ,虽然 实际 的 词 
素 可 能 并 不 包括 lexemeBegin 指针 和 Jforward 指针 之 间 的 所 有 字符 。 我 们 用 双 层 的 圈 来 表示 一 个 接 
受 状态 ,并且 如 果 该 状态 要 执行 一 个 动作 的 话 一 一 通常 是 向 语法 分 析 器 返回 一 个 词法 单元 和 相 
关 属 性 值 一 我 们 将 把 这 个 动作 附加 到 该 接受 状态 上 。 

2) 另外 , 如 果 需 要 将 forward 回 退 一 个 位 置 ( 即 相应 的 词素 并 不 包含 那个 在 最 后 一 步 合 
我 们 到 达 接 受 状态 的 符号 ) , 那么 我 们 将 在 该 接受 状态 的 附近 加 上 一 个 * 。 我 们 的 例子 都 不 
需要 将 forward 指针 回 退 多 个 位 置 ， 但 万 一 出 现 这 种 情况 , 我 们 将 为 接受 状态 附加 相应 数目 
的 *。 

3) 有 一 个 状态 被 指定 为 开始 状态 ,也 称 初始 状态 ,该 状态 由 一 条 没有 出 发 结 点 的 、 标 号 为 

“start” 的 边 指明 。 在 读 人 任何 输入 符号 之 前 , 状态 转换 图 总 是 位 于 它 的 开始 状态 。 
DEE 63-13 给 出 了 能 够 识别 所 有 与 词法 单元 relop 匹配 的 词素 的 状态 转换 图 。 我 们 从 初始 
状态 0 开始 。 如 果 我 们 看 到 的 第 一 个 输入 符号 是 <， 那么 在 所 有 与 relop 模式 匹配 的 词素 中 ,我 
们 只 能 选择 < 、<> 或 <= 。 因 此 我 们 进入 状态 1 并 查看 下 一 个 字符 。 如 果 这 个 字符 是 =， 我 们 
识别 出 词素 <=， 进 入 状态 2 并 返回 属性 值 为 LE 的 relop 词法 单元 。 其 中 的 符号 常量 LE 代表 了 
这 个 具体 的 比较 运算 符 。 如 果 在 状态 1, 下 一 个 字符 是 > ,那么 我 们 就 会 得 到 词素 <> ,从 而 进入 
状态 3 并 返回 一 个 词法 单元 , 表明 已 经 找到 一 个 不 等 运算 符 。 而 对 于 其 他 字符 , 识别 得 到 的 词素 
E<, 我 们 进入 状态 4 并 向 语法 分 析 器 返回 这 个 信息 。 请 注意 ,状态 4 有 一 个 * 号 , 说 明 我 们 必 
须 将 输入 回 退 一 个 位 置 。 

另 一 方面 , 如 果 在 状态 0 时 我 们 看 到 的 第 一 个 字符 是 =, 那么 这 个 字符 必定 是 要 识别 的 词 
素 。 我 们 立即 从 状态 5 返回 这 个 信息 。 其 余 的 可 能 性 是 第 一 个 字符 为 > 的 情况 。 那 么 我 们 应 该 
进入 状态 6, 并 根据 下 一 字符 确定 词素 是 >= ( 如 果 我 们 看 到 下 一 个 字符 为 = ) 还 是 > ( 对 于 任何 
其 他 字符 ) 。 注 意 ,如果 在 状态 0 时 我 们 看 到 的 是 不 同 于 < = 或 > 的 字符 , 我 们 就 不 可 能 看 到 
一 个 relop 的 词素 , 因此 这 个 状态 转换 图 将 不 会 被 使 用 。 口 
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return( relop, GE) 


other return( relop, GT) 
图 3-13， 词 法 单元 relop 的 状态 转换 图 


3.4.2 保留 字 和 标识 符 的 识别 

识别 关键 字 及 标识 符 时 有 一 个 问题 要 解决 。 通 常 , 像 if 或 then 这 样 的 关键 字 是 被 保留 的 
(在 我 们 正在 使 用 的 例子 中 就 是 如 此 ), 因此 虽然 它们 看 起 来 很 像 标 识 符 , 但 它们 不 是 标识 符 。 
因此 , 尽管 我 们 通常 使 用 如 图 3-14 所 示 的 状态 转换 图 来 寻找 标识 符 的 词素 , 但 这 个 图 也 可 以 识 
别 出 连续 使 用 的 例子 中 的 关键 字 if, then 及 else, 


letter or digit 


start letter other : 
(9) (10) O return (getToken( ), installID()) 


Al3-14 id 和 关键 字 的 状态 转换 图 


我 们 可 以 使 用 两 种 方法 来 处 理 那 些 看 起 来 很 像 标识 符 的 保留 字 : 

1) 初始 化 时 就 将 各 个 保留 字 填 入 符号 表 中 。 符 号 表 条 目的 某 个 字段 会 指明 这 些 捉 并 不 是 普 
通 的 标识 符 , 并 指出 它们 所 代表 的 词法 单元 。 我 们 已 经 假设 图 3-14 中 使 用 了 这 种 方法 。 当 我 们 
找到 一 个 标识 符 时 ,如 果 该 标识 符 尚未 出 现在 符号 表 中 , 就 会 调用 iinstall1D 将 此 标识 符 放 人 符号 
RH, 并 返回 一 个 指针 ,指向 这 个 刚 找到 的 词素 所 对 应 的 符号 表 条 目 。 当 然 , 任何 在 词法 分 析 时 
不 在 符号 表 中 的 标识 符 都 不 可 能 是 一 个 保留 字 , 因此 它 的 词法 单元 是 ias 函数 getTokeni 查看 对 应 
于 刚 找到 的 词素 的 符号 表 条 目 ， 并 根据 符号 表 中 的 信息 返回 该 词素 所 代表 的 词法 单元 名 二 -要 
么 是 id, 要 么 是 一 个 在 初始 化 时 就 被 加 入 到 符号 表 中 的 关键 字 词 法 单元 。 

2) 为 每 个 关键 字 建 立 单独 的 状态 转换 图 。 图 3-15 是 关键 字 then 的 一 个 例子 。 请 注意 , 这 样 
的 状态 转换 图 包含 的 状态 表示 看 到 该 关键 字 的 各 个 后 续 字母 后 的 情况 ,最 后 是 二 个 “ 非 字母 或 数 
字 ” 的 测试 , 也 就 是 检查 后 面 是 否 为 某 个 不 可 能 成 为 标识 符 一 部 分 的 字符 。 有 必要 检查 该 标识 符 
是 否 结束 , 否则 在 碰 到 词素 像 thenextvalue WHEL then 为 前 级 的 记 词法 单元 时 , 我 们 可 能 
会 错误 地 返回 词法 单元 then。 如 果 采 用 这 个 方法 , 我 们 必须 设 定 词法 单元 之 间 的 优先 级 ,使 得 
当 一 个 词素 同时 匹配 id 的 模式 和 关键 字 的 模式 时 , 优先 识别 保留 字 词 法 单元 , 而 不 是 记 词法 单 
元 。 我 们 并 没有 在 例子 中 使 用 这 个 方法 , 这 也 是 我 们 没有 对 图 3-15 中 的 状态 进行 编号 的 原因 。 


start t h e niet/di 


图 3-15 假想 的 关键 字 then 的 状态 转换 图 
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3.4.3 完成 我 们 的 例子 

我 们 在 图 3-14 FÆR, id 的 状态 转换 图 有 一 个 简单 的 结构 。 由 状态 9 开始 , 它 检查 被 识别 
的 词素 是 否 以 一 个 字母 开头 ,如 果 是 的 话 进入 状态 10。 只 要 接 下 来 的 输入 包含 字母 或 数位 , 我 们 
就 一 直 停 留 在 状态 10。 当 我 们 第 一 次 遇 到 不 是 字母 或 数位 的 其 他 任何 字符 时 , 便 转 入 状态 11 并 
接受 刚刚 找到 的 词素 。 因 为 最 后 一 个 字符 并 不 是 标识 符 的 一 部 分 , 我 们 必须 将 输入 回 退 一 个 位 
E, 并 且 如 3.4.2 节 所 讨论 的 那样 , 我 们 将 已 经 找到 的 标识 符 加 入 到 符号 表 中 , 并 判断 我 们 得 到 
的 究竟 是 一 个 关键 字 还 是 一 个 真正 的 标识 符 。 

图 3-16 显示 了 词法 单元 number 的 状态 转换 图 , 它 是 我 们 至 今 为 止 看 到 的 最 复杂 的 状态 转 
RE. MRE 12 开始 , 如 果 我 们 看 到 一 个 数位 , 就 转 入 状态 13。 在 该 状态 , 我 们 可 以 读 入 任意 
数量 的 其 他 数位 。 然 而 ,如 果 我 们 看 到 了 一 个 不 是 数位 、 不 是 小 数 点 ,也 不 是 卫 的 其 他 字符 ,就 
得 到 了 一 个 整数 形式 的 数字 , 如 123 。 这 种 情形 在 进入 状态 20 时 进行 处 理 , 我 们 在 该 状态 返回 
词法 单元 number 以 及 一 个 指向 常量 表 条 目的 指针 ,刚刚 找到 的 词素 便 放 在 这 个 常量 表 条 目 中 。 
这 些 机 制 并 没有 在 这 个 转换 图 中 显示 出 来 , 但 它们 和 我 们 处 理 标识 符 的 方法 相似 。 


digit digit digit ， 








图 3-16 无 符号 数字 的 状态 转换 图 


如 果 我 们 在 状态 13 看 到 的 是 一 个 小 数 点 , 那么 我 们 就 看 到 一 个 “可 选 的 小 数 部 分 "。 于 是 ， 
进入 状态 14, 并 寻找 一 个 或 多 个 更 多 的 数位 , 状态 15 就 被 用 于 此 目的 。 如 果 我 们 看 到 一 个 , W 
么 我 们 就 看 到 了 一 个 “可 选 的 指数 部 分 ”, 它 的 识别 任务 由 状态 16 ~19 完成 。 如 果 我 们 在 状态 15 
看 到 的 是 不 同 于 和 数位 的 其 他 字符 , 那么 我 们 就 到 达 了 小 数 部 分 的 结尾 ,这 个 数字 没有 指数 部 
分 , 我 们 将 通过 状态 21 返回 刚刚 找到 的 词素 。 

最 后 一 个 状态 转换 图 显示 在 图 3-17 中 , 它 用 于 识别 空白 符 。 在 该 图 中 , 我 们 寻找 一 个 或 多 
个 空白 字符 ,在 图 中 用 delim 表示 。 典 型 的 空白 字符 有 空格 、 制 表 符 , 换行 符 ， 有 可 能 包括 那些 
根据 语言 设计 不 可 能 出 现在 任何 词法 单元 中 的 字符 。 

注意 , 我 们 在 状态 24 中 找到 了 一 个 连续 的 空白 字符 组 TE 
成 的 块 ， 且 后 面 还 跟随 一 个 非 空白 字符 。 我 们 将 输入 回 退 sat gan O we A. 
到 这 个 非 空白 符 的 开头 , 但 我 们 并 不 向 语法 分 析 器 返回 任 © © 
何 词法 单元 。 相反, 我 们 必须 在 这 个 空白 符 之 后 再 次 启动 wae 网 
词法 分 析 过 程 : 图 3-17 空白 符 的 状态 转换 图 
3.4.4 “基于 状态 转换 图 的 词法 分 析 器 的 体系 结构 | 

有 几 种 方法 可 以 根据 一 组 状态 转换 图 构造 出 一 个 词法 分 析 器 。 不 管 整体 的 策略 是 什么 ,每 
个 状态 总 是 对 应 于 一 段 代码 。 我 们 可 以 想象 有 一 个 变量 state 保存 了 一 个 状态 转换 图 的 当前 状 
态 的 编号 。 有 一 个 switch 语句 根据 state 的 值 将 我 们 转 到 对 应 于 各 个 可 能 状态 的 相应 代码 段 ， 
我 们 可 以 在 那里 找到 该 状态 需要 执行 的 动作 。 一 个 状态 的 代码 本 身 常常 也 是 一 条 switch 语句 或 
多 路 分 支 语句 。 这 个 语句 读 人 并 检查 下 一 个 输入 字符 , 由 此 确定 下 一 个 状态 。 
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在 图 3-18 中 , 我 们 可 以 看 到 getRelop() 方 法 的 一 个 概述 。 它 是 一 个 C++ 函数 ,其 
任务 是 模拟 图 3-13 中 的 状态 转换 图 , 并 返回 一 个 TOKEN 类 型 的 对 象 。 该 对 象 由 一 个 词法 单元 名 
(在 该 例 中 必定 是 relop) 和 一 个 属性 值 (在 该 例 中 是 6 个 比较 运算 符 之 一 的 编码 ) 组 成 。 函 数 
getRelop( ) 首 先 创 建 一 个 新 的 对 象 retToken ,并 将 该 对 象 的 第 一 个 分 量 初始 化 为 RELOP, 即 
词法 单元 relop 的 编码 。 

在 case 0 H, 我 们 可 以 看 到 一 个 典型 的 状态 行为 。 函 数 nextChar( ) 从 输入 中 获取 下 一 个 
字符 , 并 将 它 赋 给 局 部 变量 ce。 然后 我 们 检查 c 是 否 为 我 们 期 望 找到 的 三 个 字符 , 并 在 每 种 情况 
下 根据 图 3-13 所 示 的 状态 转换 图 完成 状态 转换 。 例 如 ,如 果 下 一 输入 字符 是 =, 那么 就 转换 到 
状态 5。 

如 果 下 一 个 输入 字符 不 是 某 个 比较 运算 符 的 首 字符 ,getRelop( ) 就 会 调用 函数 fail(). 
函数 fail( ) 的 具体 操作 依赖 于 词法 分 析 器 的 全 局 错误 恢复 策略 。 它 应 该 将 forward 指针 重 置 
为 lexemeBegin 的 值 , 使 得 我 们 可 以 使 用 另 一 个 状态 转换 图 从 尚未 处 理 的 输入 部 分 的 真实 开始 
位 置 开 始 识别 。 然 后 , 它 还 需要 将 变量 state 的 值 改 为 男 一 状态 转换 图 的 初始 状态 , 该 转换 图 
将 寻找 另 一 个 词法 单元 。 在 另 一 种 情况 下 , 如果 所 有 的 转换 图 都 已 经 用 过 , 则 fail( ) 可 以 启动 
一 个 错误 纠正 步骤 , 按照 3.1.4 节 中 讨论 的 方法 来 纠正 输入 并 找到 一 个 词素 。 

在 图 3-18 H, 我 们 还 展示 了 状态 8 的 行为 。 由 于 状态 8 带 有 一 个 * 号 , 我 们 必须 将 输入 指针 
回 退 一 个 位 置 ( 也 就 是 把 c 放 回 输入 流 ) 。 该 任务 由 函数 retract( ) 完 成 。 因 为 状态 8 代表 了 对 
词素 > 的 识别 , 我 们 把 返回 对 象 中 的 第 二 个 分 量 设置 成 GT, 即 这 个 运算 符 的 编码 。 我 们 假设 这 
个 分 量 的 名 字 是 attribute, 口 


TOKEN getRelop() 
t 


TOKEN retToken = new(RELOP); 
while(1) { /* repeat character processing until a return 
or failure occurs */ 
switch(state) { 
case 0: c = nextChar(); 

if ( c == '<' ) state = 1; 
else if (c == '=' ) state = 5; 
else if ( c == '>' ) state = 6; 
else fail(); /* lexeme is not a relop */ 
break; 


retract (); 
retToken.attribute = GT; 
return (retToken) ; 





图 3-18 ”relop 的 转换 图 的 概要 实现 


为 了 在 适当 的 地 方 模拟 适当 的 状态 转换 图 , 我 们 考虑 几 种 将 如 图 3-18 所 示 的 代码 集成 到 整 
个 词法 分 析 器 中 的 方法 。 

1) 我 们 可 以 证 词法 分 析 器 顺序 地 尝试 各 个 词法 单元 的 状态 转换 图 。 然 后 , 在 每 次 调用 例 
3. 10 中 的 函数 fail( ) 时 , EME forward 指针 并 启动 下 一 个 状态 转换 图 。 这 个 方法 使 我 们 可 
以 像 图 3-15 中 所 建议 的 那样 , 为 各 个 关键 字 使 用 各 自 的 状态 转换 图 。 我 们 只 需要 在 使 用 id 的 状 
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态 转换 图 之 前 使 用 这 些 关键 字 的 转换 图 , 就 可 以 使 得 关键 字 被 识别 为 保留 字 。 

2) 我 们 可 以 “并 行 地 ”运行 各 个 状态 转换 图 , 将 下 一 个 输入 字符 提供 给 所 有 的 状态 转换 图 ， 
并 使 得 每 个 状态 转换 图 作出 它 应 该 执行 的 转换 。 如 果 我 们 采用 这 个 策略 , 就 必须 谨慎 地 解决 如 
下 的 问题 : 一 个 状态 转换 图 已 经 找到 了 一 个 与 它 的 模式 相 匹配 的 词素 , 但 另外 的 一 个 或 多 个 状态 
转换 图 仍然 可 以 继续 处 理 输入 。 解 决 这 个 问题 的 常见 策略 是 取 最 长 的 和 某 个 模式 相 匹 配 的 输入 
WAR, 举例 来 说 , 该 规则 让 我 们 识别 出 标识 符 thenext 而 不 是 关键 字 then, 识别 出 -> 而 不 是 - o 

3) 有 一 个 更 好 的 方法 , 也 是 我 们 将 在 下 面 各 节 中 采用 的 方法 , 就 是 将 所 有 的 状态 转换 图 合 
并 为 一 个 图 。 我 们 允许 合并 后 的 状态 转换 图 尽量 读 取 输入 ,直到 不 存在 下 一 个 状态 为 止 ; 然后 像 
上 面 的 2 中 讨论 的 那样 取 最 长 的 和 某 个 模式 匹配 的 最 长 词素 。 在 我 们 的 例子 中 , 进行 这 种 合并 很 
简单 ， 因 为 没有 两 个 词法 单元 以 相同 的 字符 开头 。 也 就 是 说 , 根据 第 一 个 字符 就 可 以 知道 我 们 正 
在 寻找 的 是 哪个 词法 单元 。 因 此 , 我 们 可 以 直接 将 状态 0、9、12 及 22 合并 成 一 个 开始 状态 , 并 
保持 其 他 转换 不 变 。 但 一 般 而 言 , 正如 我 们 不 久 将 看 到 的 那样 , 合并 几 个 词法 单元 的 状态 转换 图 
的 问题 会 更 加 复杂 。 
3.4.5 3.4 节 的 练习 

练习 3. 4.1: 给 出 识别 练习 3. 3: 2 中 各 个 正则 表达 式 所 描述 的 语言 的 状态 转换 图 。 

练习 3.4.2; 给 出 识别 练习 3,3.5 中 各 个 正则 表达 式 所 描述 的 语言 的 状态 转换 图 。 

从 下 面 的 练习 开始 到 练习 3.4. 12 介绍 了 Aho-Corasick HIE, 该 算法 可 以 在 文本 串 中 识别 一 
组 关键 字 , 所 需 时 间 和 文本 长 度 以 及 所 有 关键 字 的 总 长 度 成 正比 。 该 算法 使 用 了 一 种 称 为 “trie” 
的 特殊 形式 的 状态 转换 图 。trie 是 一 个 树 型 结构 的 状态 转换 图 ， 从 一 个 结 点 到 它 的 各 个 子 结 点 的 
边 上 有 不 同 的 标号 。Trie 的 叶子 结 点 表示 识别 到 的 关键 字 。 

Knuth, Morris 和 Pratt 提出 了 一 种 在 文本 串 中 识别 单个 关键 字 bibb, 的 算法 。 这 里 的 trie 
是 一 个 包含 了 从 0 ~n den +1 个 状态 的 状态 转换 图 s 状态 0 是 初始 状态 ,状态 nn 表示 接受 , 也 就 
是 发 现 关键 字 的 情形 。 从 0 到 n -1 之 间 的 任意 一 个 状态 s HR, 存在 一 个 标号 为 5b. ,1 的 到 达 状 
态 s+1 的 转换 。 例 如 , 关键 字 ababaa 的 trie HH: 


O-O—+O+-+O—-+O--O © 


为 了 快速 处 理 文本 串 并 在 这 些 串 中 搜索 一 个 关键 字 ,针对 关键 字 bibb, 以 及 该 关键 字 中 
的 位 置 s( 对 应 于 关键 字 的 trie 中 的 状态 s) ELKAR), 该 函数 的 计算 方法 如 图 3-19 所 示 。 

该 函数 的 目标 是 使 得 by bg) 是 最 长 的 既是 bibb, WANANE bibb, 的 后 缀 的 子 
串 。/(s) 之 所 以 重要 , 原因 在 于 如 果 我 们 试图 用 一 个 文本 串 匹 配 5152…b,, ,并 且 我 们 已 经 匹配 了 
前 s 个 位 置 , 但 此 时 匹配 失败 (也 就 是 说 文本 串 的 下 一 个 位 置 并 不 是 5, ,1), 那么 f(s) 就 是 可 能 和 
以 我 们 的 当前 位 置 为 结尾 的 文本 串 相 匹 配 的 最 长 的 by bab, 的 前 级 。 当 然 , 文本 串 的 下 一 个 字 
符 必 须 是 bros 否则 仍然 有 问题 ,必须 考虑 一 个 更 短 的 前 缀 , 即 bn,)) 。 

看 一 个 例子 , 根据 ababaa 构造 的 trie 的 失效 函数 是 : 


| s 1|12131415|6| 
| f(s) L010l1121311| 


例如 , 状态 3 和 1 分 别 表示 前 缀 aba 以 及 a。 因 为 a 是 最 长 的 既是 aba WANA, 同时 也 是 aba 
WERKE, 因此 f(3) =15 同样 ,因为 最 长 的 既是 ab 的 真 前 级 又 是 它 的 后 级 的 字符 串 是 空 串 ， 
因此 f(2) =0。 

练习 3.4.3: :构造 下 列 串 的 失效 函数 。 
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1) abababaab 
2) aaaaaa 
3) abbaabb 


TY) t 0; 
20 f(1) = 0; 
8) for (s=13 <n; att) 4 
while (t > 0 && bsi1 != b1) t = f(t); 
if (bs41 = bit) { 
t=t+1; 
f(s+1)=t; 


} 
else f(s +1) = 0; 





图 3-19， 计 算 关 键 字 bibb, 的 失效 函数 的 算法 


| 练习 3.4.4: 对 * 进行 归纳 , 证 明 图 3-19 的 算法 正确 地 计算 出 了 失效 函数 。 

11 练习 3.4.5: 说 明 图 3-19 中 第 4 行 的 赋值 语句 1=f(1) 最 多 被 执行 nn 次。 进而 说 明 整 个 算 
法 的 时 间 复 杂 度 是 O(n), 其 中 是 关键 字 的 长 度 。 

计算 得 到 关键 字 bbrd, 的 失效 函数 之 后 , 我 们 就 可 以 在 0(w) 时 间 内 扫描 字符 串 claz … 
On 以 判断 该 关键 字 是 否 出 现在 其 中 。 图 3-20 中 所 展示 的 算法 使 关键 字 沿 着 被 匹配 字符 串 滑动 ， 
不 断 尝试 将 关键 字 的 下 一 个 字符 与 被 匹配 字符 串 的 下 一 个 字符 匹配 , 逐步 推进 。 如 果 在 匹配 了 s 
个 字符 后 无 法 继续 匹配 , 那么 该 算法 将 关键 字 “ 向 右 滑 动 ”s -f(s) 个 位 置 , 也 就 是 认为 只 有 该 关 
键 字 的 前 f(s) 个 字符 和 被 匹配 字符 串 匹 配 。 

练习 3. 4. 6: 应 用 KMP 算法 判断 关键 字 ababaa 是 否 为 下 面 字 符 串 的 子 串 : 

1) abababaab 

2) abababbaa 

1! 练习 3. 4.7: 说 明 图 3-20 中 的 算法 可 以 正确 地 指出 输入 关键 字 是 否 为 一 个 给 定 字符 串 的 
FH, RT: 对 i 进行 归纳 。 说 明 对 于 所 有 的 i, 在 第 四 行 运行 后 * 的 值 是 那些 既是 a1a，…a; 的 后 
缀 又 是 该 关键 字 的 前 绥 的 字符 串 中 最 长 字符 串 的 长 度 。 


1) #=0; 
2) for (i=1;i< m; i++) { 
3) while (s > 0 && a;!= bs41) s = f(s); 


if (a; == s+41)'8 =s+1; 
if (s == n) return “yes”; 


return “no”; 





图 3-20 KMP 算法 在 0(m+n) 时 间 内 检测 字符 串 a1a,…a 中 是 否 包 含 单个 关键 字 bibb, 


1! 练习 3.4. 8 :假设 已 经 计算 得 到 函数 f 且 它 的 值 存储 在 一 个 以 s 为 下 标的 数组 中 , 说 明 图 
3-20 中 算法 的 时 间 复 杂 度 为 0(m +n)。 

练习 3.4.9: Fibonacci 字符 串 的 定义 如 下 : 

1) si 2b, 

2) aa 

3) X k>? 时 ， Sk =Sk-1$k-20 
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例如 , ss = ab, s4 =aba, ss =abaab, 

1) s, 的 长 度 是 多 少 ? 

2) 构造 se 的 失效 函数 。 

3) 构造 s7 的 失效 函数 。 

11 4) WEHEN s, 的 失效 函数 都 可 以 被 表示 为 : f(1) =f(2)=0, HX F 2 <j<1s,1, fG) = 
J- |s% _1| ,其 中 是 使 得 1s,| <j +1 的 最 大 的 整数 。 

1! 5) 在 KMP 算法 中 ， 当 我 们 试图 确定 关键 字 si 是 否 出 现在 字符 串 % ,1 中 时 , 最 多 会 连续 
多 少 次 调用 失效 函数 ? 

Aho 和 Corasick 对 KMP 算法 进行 了 推广 , 使 它 可 以 在 一 个 文本 串 中 识别 一 个 关键 字 集合 中 
的 任何 关键 字 。 在 这 种 情况 下 , trie 是 一 棵 真正 的 树 ， 从 其 根 结 点 开始 就 会 出 现 分 支 。 如 果 一 个 
字符 串 是 某 个 关键 字 的 前 缀 (不 二 定 是 真 前 级 ), 那么 在 trie 中 就 有 一 个 和 该 字符 串 对 应 的 状态 。 
P 616，…bj_1 对 应 的 状态 是 串 bibr b, 对 应 的 状态 的 父 结 点 。 如 果 一 个 状态 对 应 于 某 个 完整 的 
关键 字 , 那么 该 状态 就 是 接受 状态 。 例 如 , 图 3-21 显示 了 对 应 于 关键 字 he, she, his Ñ hers 
的 trie 树 。 








图 3-21 关键 字 he、she、 his Ml hers ff trie Hf 


通用 trie 树 的 失效 函数 的 定义 如 下 。 假 设 * EMF E bibb, 的 状态 , 那么 状态 fs) 对 应 
于 最 长 的 、 既 是 串 bibr b, 的 后 缀 又 是 某 个 关键 字 的 前 绥 的 字符 串 。 例 如 , 图 3-21 中 trie 树 的 失 


效 函 数 为 : 
Le)10101011121013|013 
| 练习 3.4.10: 修改 图 3-19 中 的 算法 , 使 它 可 以 计算 通用 trie 树 的 失效 函数 。 提 示 : 主要 
的 不 同 在 于 , 在 图 3-19 的 第 4、5 行 上 ， 我 们 不 能 简单 地 测试 3,1 和。 ,1 是 否 相 等 。 从 任何 一 个 
状态 出 发 , 都 可 能 存在 多 个 在 不 同 字符 上 的 转换 。 比 如 在 图 3-21 中 , 存在 从 状态 1 出 发 、 分 别 在 
字符 e Ali 上 的 两 个 转换 。 这 些 转 换 都 可 能 进入 代表 了 最 长 的 既是 后 级 又 是 前 级 的 字符 串 的 状 


x 


yo 


练习 3. 4. 11: 为 下 面 的 关键 字 集 合 构造 trie 以 及 失效 函数 。 
1) aaa, abaaa 和 ababaaa, 

2) all, fall, fatal. Llama Al lame, 

3) pipe, pet, item, temper ĤI perpetual, 


! 练习 3. 4. 12 :说 明 练 习 3. 4. 10 中 所 设计 的 算法 的 运行 时 间 和 所 有 关键 字 长 度 的 总 和 成 线 
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3.5 词法 分 析 器 生成 工具 Lex 


在 本 节 中 , 我 们 将 介绍 一 个 名 为 Lex 的 工具 。 在 最 近 的 实现 中 它 也 称 为 Flex。 它 支持 使 用 正 
则 表达 式 来 描述 各 个 词法 单元 的 模式 , 由 此 给 出 一 个 词法 分 析 器 的 规约 。Lex 工具 的 输入 表示 方 
法 称 为 Lex 语言 (Lex language) , 而 工具 本 身 则 称 为 Lex 编译 器 (Lex compiler) 。 在 它 的 核心 部 分 ， 
Lex 编译 器 将 输入 的 模式 转换 成 一 个 状态 转换 图 , 并 生成 相应 的 实现 代码 ,并 存放 到 文件 
lex. yy. c 中 。 这 些 代码 模拟 了 状态 转换 图 。 如 何 将 正则 表达 式 翻 译 为 状态 转换 图 是 下 一 节 讨 
论 的 主题 , 这 里 我 们 只 学 习 Lex 语言 。 
3.5.1 Lex 的 使 用 

Lex 的 使 用 方法 如 图 3-22 所 示 。 首 先 , 用 Lex 语言 写 出 一 个 输入 文件 , 描述 将 要 生成 的 词法 
分 析 器 。 在 图 中 这 个 输入 文件 称 为 lex.1。 然后 ,Lex 编译 器 将 lex. 1 转换 成 C 语言 程序 , 存 
放 该 程序 的 文件 名 总 是 lex.yy.c。 最后, 文件 lex. yy. c 总 是 被 C 编译 器 编译 为 一 个 名 为 a. out 
的 文件 。C 编译 器 的 输出 就 是 一 个 读 取 输入 字符 流 并 生成 词法 单元 流 的 可 运行 的 词法 分 析 器 。 

编译 后 的 C 程序, 在 图 3-22 中 被 称 为 a. out, 通常 是 一 个 被 语法 分 析 器 调用 的 子 例 程 , 这 个 
子 例 程 返 回 一 个 整数 值 , 即 可 能 出 现 的 某 个 词法 单元 名 的 编码 。 而 词法 单元 的 属性 值 , KECE 
一 个 数字 编码 , 还 是 一 个 指向 符号 表 的 指针 , 或 者 什么 都 没有 , 都 保存 在 全 局 变量 yylval HO, 
这 个 变量 由 词法 分 析 器 和 语法 分 析 嚣 共享。 这么 做 可 以 同时 返回 一 个 词法 单元 名 字 和 一 个 属 
性 值 。 
3.5.2 Lex 程序 的 结构 

一 个 Lex 程序 具有 如 下 形式 : 

声明 部 分 

% % 

转换 规则 

% % 

辅助 函数 

声明 部 分 包括 变量 和 明示 常量 (manifest con- 
stant， 被 声明 的 表示 一 个 常数 的 标识 符 ， 如 一 个 词 
法 单元 的 名 字 ) 的 声明 和 3. 3.4 节 中 描述 的 正则 定义 。 

Lex 程序 的 每 个 转换 规则 具有 如 下 形式 : 

模式 | SHE } 

其 中 , 每 个 模式 是 一 个 正则 表达 式 , 它 可 以 使 用 声明 部 分 中 给 出 的 正则 定义 。 动作 部 分 是 代码 片 
Bio 虽然 人 们 已 经 创建 了 很 多 能 使 用 其 他 语言 的 Lex 的 变 体 , 但 这 些 代码 片段 通常 是 用 C 语言 
Bi. 

Lex 程序 的 第 三 个 部 分 包含 各 个 动作 和 需要 使 用 的 所 有 辅助 函数 。 还 有 一 种 方法 是 将 这 些 函数 
单独 编译 ， 并 与 词法 分 析 器 的 代码 二 起 装载 。 

由 Lex 创建 的 词法 分 析 器 和 语法 分 析 器 按照 如 下 方式 协同 工作 ， 当 词 法 分 析 器 被 语法 分 析 
器 调用 时 , 词法 分 析 器 开始 从 余下 的 输入 中 逐个 读 取 字符 ， 直到 它 发 现 了 最 长 的 与 某 个 模式 Pi 





图 3-22 用 Lex 创建 一 个 词法 分 析 器 





日 顺便 说 一 下 , 在 yylval fl lex yy :ic 中 出 现 的 yy 指 的 是 我 们 将 在 4.9 节 中 讨论 的 语法 分 析 器 生成 工具 yace, © 
一 般 和 Lex 一 起 使 用 。 


90 第 3 章 





匹配 的 前 级 。 然 后 , 词法 分 析 器 执行 相关 的 动作 4;。 通 常 4; 会 将 控制 返回 给 语法 分 析 器 。 然 而 ， 
如 果 它 不 返回 控制 ( 比如 Pi; 描述 的 是 空白 符 或 注释 ) , 那么 词法 分 析 器 就 继续 寻找 其 他 的 词素 ， 
于 到 革 个 动作 将 控制 返回 给 语法 分 析 器 为 止 。 词 法 分 析 器 只 向 语法 分 析 器 返回 一 个 值 ， 即 词法 
单元 各。 但 在 需要 时 可 以 利用 共享 的 整 型 变量 yy1val 传递 有 关 这 个 词素 的 附加 信息 。 
DE 63-2321 Lex 程序 , 它 能 够 识别 图 3-12 中 的 各 个 词法 单元 , 并 返回 找到 的 词法 
单元 。 观 察 这 段 代 码 可 以 发 现 Lex 的 很 多 重要 特点 。 

我 们 在 声明 部 分 看 到 一 对 特殊 的 括号 : | 和 外 。 出 现在 括号 内 的 所 有 内 容 都 被 直接 复制 到 
文件 Lex. yy c 中 。 它 们 不 会 被 当 作 正 则 定义 处 理 。 我 们 一 般 将 明示 常量 的 定义 放置 在 该 括号 
内 , 并 利用 C 语言 的 kaefine 语句 给 每 个 明示 常量 赋予 一 个 唯一 的 整数 编码 。 在 我 们 的 例子 中 ， 
我 们 在 一 个 注释 中 列 出 了 LT IF 等 明示 常量 , 但 没有 显示 它们 被 赋予 哪些 特定 的 整数 。 

在 声明 部 分 还 包含 卫 不 正则 定义 的 序列 。 这 些 定义 使 用 了 3. 3. 5 节 中 描述 的 正则 表达 式 的 
扩展 表示 方法 。 那 些 将 在 后 面 的 定义 中 或 某 个 转换 规则 的 模式 中 使 用 的 正则 定义 用 花 括号 括 起 
来 。 例 如 ,delim 被 定义 为 表示 一 个 包含 了 空格 、 制 表 符 及 换行 符 的 字符 类 的 缩写 。 后 两 个 字符 
分 别 用 反 斜 线 再 眼 上 + 及 来 表示 。 这 个 表示 法 和 UNIX 命令 使 用 的 方法 相同 。 于 是 ,ws 通过 正 
则 表达 式 |aelim| + 定义 为 一 个 或 多 个 分 隔 符 组 成 的 序列 。 

注意 , 在 讼 和 number 的 定义 中 , 圆 括号 是 用 于 分 组 的 元 符号 ,并 不 代表 圆 括号 自身 。 相 反 ， 
在 number ELPRE RERA Y. MURATA Lex 的 某 个 元 符号 (比如 括号 、+ 、* 或 ? 等 ) 
表示 其 自身 , 我 们 可 以 在 它们 前 面 加 上 一个 反 斜 线 。 例 如 , 我 们 在 number 的 定义 中 看 到 的 \. 就 
表示 小 数 点 本 身 。 在 它 前 面 加 上 反 斜 线 的 原因 是 ， 和 在 UNIX 正则 表达 式 中 一 样 ,该 字符 在 Lex 
中 是 一 个 代表 “ 任 一 字符 ”的 元 符号 。 

在 辅助 函数 部 分 , 我 们 可 以 看 到 这 样 两 个 函数 : installID( ) 和 installNum()。 和 位 
于 %|… 外 中 的 声明 部 分 一 样 , 出 现在 辅助 部 分 中 的 所 有 内 容 都 被 直接 复制 到 文件 lex.yy:c 中 。 
虽然 它们 位 于 转换 规则 部 分 之 后 , 但 这 些 函 数 可 以 在 规则 部 分 的 动作 定义 中 使 用 。 

最 后 , 让 我 们 看 一 下 图 3-23 的 中 间 部 分 的 一 些 模式 和 规则 。 首 先 , 在 第 一 部 分 中 定义 的 标 
识 符 ws 有 一 个 相关 的 空 动作 。 如 果 我 们 发 现 了 一 个 空白 符 , 我 们 并 不 把 它 返回 给 语法 分 析 器 ， 
而 是 继续 寻找 另 一 个 词素 。 第 二 词法 单元 有 一 个 简单 的 正则 表达 式 模式 i£。 如 果 我 们 在 输入 中 
看 到 两 个 字母 if, 并 且 if 之 后 没有 跟随 其 他 字母 或 数位 ( 如 果 有 的 话 , 词法 分 析 器 会 去 寻找 一 
个 和 这 模式 匹配 的 最 长 输入 前 缀 ) ,然后 词法 分 析 器 从 输入 中 读 和 人 这 两 个 字符 , 并 返回 词法 单元 
名 IF, 也 就 是 明示 常量 IF 所 代表 的 整数 值 。 关 键 字 then 和 else 的 处 理 方法 与 此 类 似 。 

第 五 个 词法 单元 的 模式 由 id 定义 。 注 意 , 虽然 像 站 这 样 的 关键 字 既 和 这 个 模式 匹配 ,也 和 
之 前 的 一 个 模式 匹配 , 但 是 当 最 长 匹配 前 级 和 多 个 模式 匹配 时 ，Lex 总 是 选择 最 先 被 列 出 的 模式 。 
当 记 被 匹配 时 ， 相 应 的 处 理 动作 分 为 三 步 ; 

1) 调用 函数 instal1ID( ) 将 找到 的 词素 放 人 符号 表 中 。 

2) 该 函数 返回 一 个 指向 符号 表 的 指针 。 这 个 指针 被 放 到 全 局 变量 yylval 中 ,并 可 被 语法 
分 析 器 或 编译 器 的 某 个 后 续 组 件 使 用 。 注 意 , 函数 installID() 可 以 使 用 以 下 两 个 由 Lex 生成 
的 < 由 词法 分 析 器 自动 赋值 的 变量 : 

e yytext 是 一 个 指向 词素 开头 的 指针 , 与 图 3-3 中 的 lexemeBegin 类 似 。 





© WR Lex 同 Yacc 一 起 使 用 , 那么 明示 常量 通常 会 在 Yacc 程序 中 定义 ; 并 在 Lex 程序 中 不 加 定义 就 使 用 它们 。 因 
为 lex .yy .c 是 和 Yace 的 输出 一 起 编译 的 ,因而 这 些 常 量 在 Lex 程序 的 动作 中 也 是 可 用 的 。 
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© yyleng 存放 刚 找到 的 词素 的 长 度 。 
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/* definitions of manifest constants 

LT, LE, £U, NE, GT, GE, 

IF, THEN, ELSE, ID, NUMBER, RELOP */ 
分 


/* regular definitions */ 


delim [ \t\n] 

ws {delim}+ 

letter [A-Za-z] 

digit [0-9] 

id {letter} ({letter} |{digit})* 


number {digit} (\.{digit}+)? (E[+-]?{digit}+)? 


{ws} {/* no action and no return */} 

if {return (IF) ;} 

then {return (THEN) ;} 

else {return (ELSE) ;} 

{id} {yylval = (int) installID(); return(ID) ;} 


{number} {yylval = (int) instal1Num(); return (NUMBER) ;} 


nen {yylval = LT; return(RELOP) ;} 
Nee {yylval = LE; return(RELOP) ;} 
"an {yylval = EQ; return (RELOP) ;} 
"<>" {yylval = NE; return (RELOP) ;了 
"yu {yylval = GT; return (RELOP) ;} 
"=" {yylval = GE; return (RELOP) i } 





hh 


int installID() {/* function to install the lexeme, whose 
first character is pointed to by yytext, 
and whose length is yyleng, into the 
symbol table and return a pointer 
thereto */ 

} 


int installNum() {/* similar to installID, but puts numer- 
i¢al constants into a separate table */ 


J 


3-23 ”识别 图 3-12 中 的 词法 单元 的 Lex 程序 


3) 将 词法 单元 名 ID 返回 到 语法 分 析 器 。 

当 王 不 词素 与 模式 number 匹配 时 ,执行 的 处 理 与 此 类 似 , 它 使 用 辅助 函数 installNum( ) 
完成 处 理 。 oO 
3.5.3 Lex 中 的 冲突 解决 

前 面 我 们 已 经 间接 提 到 了 Lex 解决 冲突 的 两 个 规则 。 当 输入 的 多 个 前 缀 与 一 个 或 多 个 模式 
匹配 时 ,Lex 用 如 下 规则 选择 正确 的 词素 : 

1) 总 是 选择 最 长 的 前 级 。 

2) 如 果 最 长 的 可 能 前 级 与 多 个 模式 匹配 ,总 是 选择 在 Lex 程序 中 先 被 列 出 的 模式 。 
DEB 第 一 个 规则 告诉 我 们 , 要 持续 读 入 字母 和 数位 , 寻找 最 长 的 由 这 些 字符 组 成 的 前 缀 并 
将 它们 组 合成 为 一 个 标识 符 。 它 也 告诉 我 们 应 该 将 <= 看 成 是 一 个 词素 , 而 不 是 将 < 看 作 一 个 词 
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素 、 再 将 = 看 作 下 一 个 词素 。 如 果 我 们 在 Lex 程序 中 将 关键 字 的 模式 置 于 id 的 模式 之 前 , 那么 第 
二 个 规则 将 使 得 关键 字 成 为 保留 字 。 例 如 , 如果 then 被 确定 为 和 某 个 模式 匹配 的 最 长 输入 前 
级 , 并 且 如 图 3-23 Prax, 模式 then 被 置 于 | idj 之 前 , 那么 返回 的 词法 单元 将 是 THEN, 而 不 是 
TD, a 
3.5.4 向 前 看 运算 符 

Lex 自动 地 向 前 读 入 一 个 字符 , 它 会 读 取 到 形成 被 选 词素 的 全 部 字符 之 后 的 那个 字符 , 然后 
再 回 退 输入 , 使 得 只 有 词素 本 身 从 输入 中 消耗 掉 。 但 是 在 某 些 时 候 , 我 们 希望 仅 当 词素 的 后 面 跟 
随 特 定 的 其 他 字符 时 , 这 个 词素 才能 和 某 个 特定 的 模式 相 匹 配 。 在 这 种 情况 下 , 我 们 可 以 在 模式 
中 用 斜 线 来 指明 该 模式 中 和 词素 实际 匹配 的 部 分 的 结尾 , 斜 线 /之 后 的 内 容 表 示 一 个 附加 的 模 
式 , 只 有 附加 模式 和 输入 匹配 之 后 , 我 们 才 可 以 确定 已 经 看 到 了 要 寻找 的 词法 单元 的 词素 , 但 是 
和 第 二 个 模式 匹配 的 字符 并 不 是 这 个 词素 的 一 部 分 。 

在 Fortran 和 一 些 其 他 语言 中 , 关键 字 并 不 是 保留 字 。 这 种 情形 会 产生 一 些 问 题 , 比 
如 下 面 的 语句 

IF(I, J) =3 
其 中 , IF 是 一 个 数组 的 名 字 , 而 不 是 关键 字 。 与 这 条 语句 形成 对 比 的 是 下 面 形式 的 语句 : 

IF ( condition ) THEN =- 

在 这 里 , IF 是 一 个 关键 字 。 幸 运 的 是 , 我 们 可 以 确定 关键 字 IF 后 面 总 是 跟着 一 个 左 括号 ， 
然后 是 一 些 可 能 包含 在 括号 中 的 文本 , 即 条 件 表达 式 , 接着 是 一 个 右 括号 和 一 个 字母 。 那 么 , 我 
们 可 以 为 关键 字 IF 写 出 如 下 的 Lex 规则 : 

TE ZNC © Ae fetter} 
这 条 规则 是 说 和 这 个 词素 匹配 的 模式 仅仅 是 两 个 字母 IF。 和 斜 线 表示 后 面 会 有 一 个 附加 的 模式 ， 
但 是 这 个 模式 并 不 和 词素 匹配 * 在 这 个 附加 模式 中 , 第 一 个 字符 是 左 括号 。 由 于 左 括号 是 Lex 的 
一 个 元 符号 , 因此 我 们 必须 在 它 的 前 面 加 上 一 个 反 斜 线 , 说 明 它 表 示 的 是 其 字面 含义 。 其 中 的 
. * 与 “任何 不 包含 换行 符 的 字符 串 ” 匹 配 。 请 注意 , 点 号 是 一 个 Lex 的 元 符号 , 表示 “ 除 换行 符 外 
的 任何 字符 ”。 接 下 来 是 一 个 右 括号 , 同样 也 加 一 个 反 斜 线 使 得 该 字符 表示 其 字面 含义 。 该 附加 
模式 的 最 后 是 符号 letter, 该 符号 是 一 个 正则 定义 , 表示 代表 所 有 字母 的 字符 类 。 

注意 , 为 了 使 该 模式 简单 可 靠 , 我 们 必须 对 输入 进行 预 处 理 , 消除 其 中 的 空白 符 。 在 该 模式 中 , 我 
们 既 没有 考虑 到 空白 符 , 也 不 能 处 理 条 件 表 达 式 跨行 的 情形 , 因为 点 号 不 能 和 一 个 换行 符 匹配 。 

例如 , 假设 该 模式 被 用 来 匹配 下 面 的 输入 前 级 : 

IF(A<(B+C) *D)THEN:: 

前 两 个 字符 和 正 匹配 , 下 一 字符 和 \( 匹 配 , 接 下 来 的 九 个 字符 和 ; * 匹配 , 再 接 下 来 的 两 个 字符 
分 别 和 \) 及 letter 匹配 。 请 注意 , 第 一 个 右 括号 (在 C 的 后 面 ) 后 面 跟 的 不 是 一 个 字母 , 这 个 事实 
与 问题 不 相关 , 因为 我 们 只 需要 找到 某 种 方式 将 输入 与 模式 相 匹 配 。 最 后 我 们 得 出 结论 , 字符 IF 
组 成 一 个 词素 , 并 且 它 们 是 词法 单元 主 的 一 个 实例 。 回 
3.5.5 3.5 THA i 

练习 3. 5.1: 描述 如 何 对 图 3-23 中 的 Lex 程序 作出 如 下 修改 : 

1) 增加 关键 字 while。 

2) 将 比较 运算 符 转 变 成 C 语言 中 的 同类 运算 符 。 

3) 允许 把 下 划 线 当 作 一 个 附加 的 字母 。 

! 4) 增 加 一 个 新 的 具有 词法 单元 STRING 的 模式 。 该 模式 由 一 个 双 引 号 (”) 、 任意 字符 串 以 
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及 结尾 处 的 一 个 双 引 号 组 成 。 但 是 , 如 果 一 个 双 引 号 出 现在 上 述 串 中 ,那么 它 的 前 面 必须 加 上 一 
个 反 斜 线 (\) 进 行 转 义 处 理 , 因此 在 该 字符 串 中 的 反 斜 线 将 用 双 反 斜 线 表示 。 这 个 词法 单元 的 词 
法 值 是 去 掉 了 双 引 号 的 字符 串 ， 并 且 其 中 用 于 转 义 的 反 斜 线 已 经 被 删除 。 识 别 得 到 的 字符 串 将 
被 存放 到 一 个 字符 串 表 中 。 

练习 3.5.2: 编写 一 个 Lex 程序 。 该 程序 拷贝 一 个 文件 , 并 将 文件 中 每 个 非 空 的 空白 符 序列 
替换 为 单个 空格 。 

练习 3. 5. 3: 编写 一 个 Lex 程序。 该 程序 拷贝 一 个 C 程序, 并 将 程序 中 关键 字 float 的 每 个 实 
例 蔡 换 成 double, 

| 练习 3.5.4: 编写 二 个 Lex 程序 。 该 程序 把 一 个 文件 改变 成 为 “Pig latin” 文 。 明 确 地 讲 ， 
假设 该 文件 是 一 个 用 空白 符 分 隔 开 的 单词 ( 即 字母 串 ) 序 列 。 每 当 你 遇 到 一 个 单词 时 : 

1) 如 果 第 一 个 字母 是 辅音 字母 , 则 将 它 移 到 单词 的 结尾 , 并 加 上 ay。 

2) 如 果 第 一 个 字母 是 元 音字 母 , 则 只 在 单词 的 结尾 加 上 ay。 

所 有 非 字 母 的 字符 不 加 处 理 直 接 拷贝 到 输出 。 

| 练习 3. 5.5; 在 SQL F, 关键 字 和 标识 符 都 是 大 小 写 不 敏感 的 。 编 写 一 个 Lex 程序 , 该 程 
序 识别 (大 小 写字 母 任意 组 合 的 ) 关键 字 SELECT, FROM 和 WHERE 以 及 词法 单元 TID。 考虑 到 这 
个 练习 的 目的 , ATE ID 看 成 是 任何 以 一 个 字母 开头 、 由 字母 和 数位 组 成 的 字符 串 。 你 不 必 
将 标识 符 存放 到 一 个 符号 表 中 , 但 需要 指出 这 里 的 “install” 函数 与 图 3-23 中 用 于 描述 大 小 写 敏感 
PRIF PRCA AT AS E o 


3.6 有 穷 自 动机 


现在 , 我 们 将 揭示 Lex 是 如 何 将 它 的 输入 程序 变 成 一 个 词法 分 析 器 的 。 转 换 的 核心 是 被 称 为 
有 穷 自 动机 (finite automata) 的 表示 方法 。 这 些 自动 机 在 本 质 上 是 与 状态 转换 图 类 似 的 图 , 但 有 
如 下 几 点 不 同 : 

1) 有 穷 自 动机 是 识别 器 (recognizer)， 它 们 只 能 对 每 个 可 能 的 输入 串 简单 地 回答 “是 ”或 
ee 

2) 有 穷 自 动机 分 为 两 类 : 

D 不 确定 的 有 穷 自动 机 (Nondeterministic Finite Automata, NFA) 对 其 边 上 的 标号 没有 任何 限 

。 一 个 符号 标记 离开 同一 状态 的 多 条 边 , 并 且 空 串 e 也 可 以 作为 标号 。 

D 对 于 每 个 状态 及 自动 机 输入 字母 表 中 的 每 个 符号 , 确定 的 有 穷 自 动机 ( Deterministic Finite 
Automata, DFA) 有 且 只 有 一 条 离开 该 状态 、 以 该 符号 为 标号 的 边 。 

确定 的 和 不 确定 的 有 穷 自 动机 能 识别 的 语言 的 集合 是 相同 的 。 事 实 上 , 这 些 语言 的 集合 正 
好 是 能 够 用 正则 表达 式 描述 的 语言 的 集合 。 这 个 集合 中 的 语言 称 为 正则 语言 《 regular lan- 
guage) © 
3.6.1 不 确定 的 有 穷 自动 机 

一 个 不 确定 的 有 穷 自动 机 (NFA) 由 以 下 几 个 部 分 组 成 : 

1) 一 个 有 穷 的 状态 集合 S- 





日” 这 里 有 个 小 问题 : 按照 我 们 的 定义 ,正则 表达 不 能 描述 空 的 语言 , 因为 我 们 在 实践 中 从 不 会 想到 使 用 这 样 的 模式 。 
但 是 , 有 穷 自 动机 可 以 定义 空 语言 。 在 理论 研究 中 ,被 视 为 一 个 额外 的 正则 表达 式 ,这 个 表达 式 的 用 途 就 是 定义 
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2) 一 个 输入 符号 集合 D, 即 输入 字母 表 (input alphabet) o HABA HIN € 不 是 与 中 
的 元 素 。 

3) 一 个 转换 函数 (transition function), 它 为 每 个 状态 各 U | ef 中 的 每 个 符号 都 给 出 了 相应 
的 后 继 状 态 (next state) 的 集合 。 

4) S 中 的 一 个 状态 so 被 指定 为 开始 状态 ,或 者 说 初始 状态 。 

5) 5 的 一 个 子 集 五 被 指定 为 接受 状态 (或 者 说 终止 状态 的 ) 集 合 。 

不 管 是 NFA 还 是 DPA, 我 们 都 可 以 将 它 表示 为 一 张 转 换 图 (trangition graph)5 图 中 的 结 点 是 
状态 , 带 有 标号 的 边 表示 自动 机 的 转换 函数 。 从 状态 * 到 状态 :存在 一 条 标号 为 “的 边 当 且 仅 当 
状态 :是 状态 :在 输入 a 上 的 后 继 状态 之 一 。 这 个 图 与 状态 转换 图 十 分 相似 , 但 是 : 

D 同一 个 符号 可 以 标记 从 同一 状态 出 发 到 达 多 个 目标 状态 的 多 条 边 。 

O 一 条 边 的 标号 不 仅 可 以 是 输入 字母 表 中 的 符号 , 也 可 以 是 空 符号 串 € 
DE 513-24 给 出 了 一 个 能 够 识别 正则 表达 式 (alb) * abb 的 语言 的 NFA 的 转换 图 。 这 个 
抽象 的 例子 描述 了 所 有 由 a 和 5 组 成 的 、 以 字符 串 abb 结尾 的 字符 串 。 这 个 例子 将 贯穿 本 节 。 虽 
然 它 很 抽象 , 但 是 实际 上 它 与 一 些 具 有 实际 意义 的 语言 的 正则 表达 式 相似 。 例 如 ,描述 所 有 其 名 
ZV) .o 结尾 的 文件 的 表达 式 是 any * . o,， 其 中 any 表示 任何 可 打印 字符 。 

沿用 状态 转换 图 中 的 惯例 , 状态 3 KNE a 


表明 该 状态 是 接受 状态 。 请 注意 , 从 状态 0 到 sn () 。 
达 接 受 状态 的 所 有 路 径 都 是 先 在 状态 0 上 运行 © -0—0 0O 
一 段 时 间 , 然后 从 输入 中 读 取 abb, 分 别 进入 状 
态 1、2 和 3。 因 此 能 够 到 达 接受 状态 的 所 有 字 
符 串 都 是 以 abb 结尾 的 。 O 图 3-24 一 个 不 确定 有 穷 自动 机 
3.6.2 转换 表 
我 们 也 可 以 将 一 个 NFA 表示 为 一 张 转 换 表 
(transition table) ， 表 的 各 行 对 应 于 状态 , 各 列 对 应 于 输入 符号 和 e。 对 应 于 一 个 给 定 状 态 和 给 定 
输入 的 条 目 是 将 NFA. 的 转换 函数 应 用 于 这 些 参数 后 得 到 的 值 。 如 果 转换 函数 没有 给 出 对 应 于 某 
个 状态 -输入 对 的 信息 , 我 们 就 把 8 放 入 相应 的 表 项 中 。 
图 3-25 显示 了 与 图 3-24 的 NFA 对 应 的 转换 表 。 口 
转换 表 的 优点 是 我 们 能 够 很 容易 地 确定 和 一 个 给 定 状态 和 一 个 输入 符号 相对 应 的 转换 。 它 
的 缺点 是 : 如 果 输入 字母 表 很 大 , 上 且 大 多 数 状态 在 大 多 数 输入 字符 上 没有 转换 的 时 候 ， 转 换 表 需 
要 占用 大 量 空间 。 Oo 
3.6.3 ”自动 机 中 输入 字符 串 的 接受 
一 个 NFA 接受 (accept) 输入 字符 串 *， 当 且 仅 当 对 应 的 转换 
图 中 存在 一 条 从 开始 状态 到 某 个 接受 状态 的 路 径 ,使 得 该 路 径 中 
各 条 边 上 的 标号 组 成 符号 串 x。 注 意 , 路 径 中 的 e 标 号 将 被 忽略 ， 








因为 空 串 不 会 影响 到 根据 路 径 构 建 得 到 的 符号 串 。 ti 
ERG 513-24 的 NFA RERS aabb, 因为 存在 如 下 从 状 。 ”的 NFA 的 转换 表 


AS 0 到 达 状 态 3 的 标号 序列 为 aabb 的 路 径 : 


a a b b 


0 Ta eae wasl 全 2 ng a) 


WER, 可 能 还 存在 多 条 具有 相同 标号 序列 、 但 是 到 达 不 同 状态 的 路 径 。 例 如 下 面 的 路 径 
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b b 


0 2 = @ S —— i æ () ra ca ; 
是 另 二 条 从 状态 0 出 发 、 标 号 序列 同样 为 aabb 的 路 径 。 这 条 路 径 最 后 仍 回 到 状态 0, 但 状态 0 不 
是 接受 状态 。 然 而 , 请 记 住 ,只 要 存在 某 条 其 标号 序列 为 某 符号 串 的 路 径 能 够 从 开始 状态 到 达 某 
PERRE, NFA 就 接受 这 个 符号 串 。 存 在 某 些 到 达 非 接受 状态 的 路 径 并 不 会 影响 这 个 结论 。 
















iS 
由 一 个 NEA spaniel PIS EAs oh a 
接受 状态 的 所 有 路 径 上 的 标号 串 的 集合 。 前 面 提 到 过 ， E 
3-24 中 的 NFA 定义 的 语 言 和 正则 表达 式 (a1b) * abb 定义 a A1) a © 
的 语言 相同 , 即 所 有 来 自 字 母 表 |o, b) 且 以 串 abb 结尾 的 串 。 war 

的 集合 。 我 们 可 以 用 LARRAINA 接受 的 语言 。 reo 

图 3-26 是 一 个 接受 L(aa* Ibb* ) 的 NFA。 因 为 
存在 如 下 的 路 径 : T 


€ a a a 


字符 串 aaa 被 这 个 NFA 接受 。 请 注意 , 路径 中 的 e le 图 3-26 ,接受 aa*1bb* 的 NFA 
ERM“ WA” ， 因此 这 条 路 径 的 标号 是 aaa。 
3. 6.4 确定 的 有 穷 自 动机 

确定 的 有 穷 自 动机 (简称 DFA) 是 不 确定 有 穷 自 动机 的 
一 个 特例 , 其 中 : 

1) RAMA e 之 上 的 转换 动作 。 

2) 对 每 个 状态 s 和 每 个 输入 符号 a, 有 且 只 有 一 条 标号 为 a WAAR so 

如 果 我 们 使 用 转换 表 来 表示 一 个 DFA, 那么 表 中 的 每 个 表 项 就 是 一 个 状态 。 因 此 我 们 可 以 
不 使 用 花 括 号 , 直接 写 出 这 个 状态 , 因为 花 括 号 只 是 用 来 说 明 表 项 的 内 容 是 一 个 集合 

NFA 抽象 地 表示 了 用 来 识别 某 个 语言 中 的 串 的 算法 , 而 相应 的 DFA 则 是 一 个 简单 具体 的 识 
别 串 的 算法 。 在 构造 词法 分 析 器 的 时 候 , 我 们 真正 实现 或 模拟 的 是 DFA。 幸 运 的 是 , 每 个 正则 表 
达 式 和 每 个 DFA 都 可 以 被 转变 成 为 一 个 接受 相同 语言 的 DFA。 下 边 的 算法 说 明了 如 何 将 DFA 用 
于 串 的 识别 。 


模拟 一 个 DFA。 
输入 : 一 个 以 文件 结束 符 eof 结尾 的 字符 串 x. DFA 刀 的 开始 状态 为 0， 接受 状态 集 为 一, 转 
HRR moves 
输出 : WR DERE x, UEA“ yes”, 否则 回答 “no”。 





2 b 





8 = 80; 


方法 : A327 中 的 算法 应 用 于 输入 字符 串 x。 BM move | c= nertCharl); 
(s, c) 给 出 了 从 状态 s 出 发 , 标号 为 6 的 边 所 到 达 的 状态 。 函数 "| While (c!= eof) { 


s = move(s,c); 


nextchar 返回 输入 串 x 的 下 一 个 字符 。 E c = neztChar(); 

例 3. 19 Al 3-28 显示 的 是 一 个 DFA 的 转换 图 。 该 DFA 接受 tei s 在 FF 中 ) return "yes"; 
的 语言 与 图 3-24 的 NFA 所 接受 的 语言 相同 , 都 是 (alb) tabb, | 259 Tetun "no" 

给 六 个 ~ 二 大 

并 返回 “yes”。 因 
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3.6.5 3.6 节 的 练习 
| 练习 3. 6. 1; 3.4 节 的 练习 中 的 图 3-19 计算 了 KMP 算法 的 失效 函数 。 说 明 在 已 知 失效 函数 
的 情况 下 ,如 何 根据 已 知 的 关键 字 b15，…b， 构造 出 一 个 具有 n+1 个 状态 的 DPA, 该 DFA 可 以 
WIRES. hbe b GEP, 点 代表 任意 字符 ) 。 更 进一步 , 证 明 构造 这 个 DFA 的 时 间 复杂 度 是 
O(n). 
练习 3.6.2: WAY 3.3.5 中 的 每 一 个 语言 设计 一 个 DFA a NFA. 
练习 3. 6. 3: 找 出 图 3-29 所 示 的 NFA 中 所 有 标号 为 aabb 的 路 径 。 这 个 NFA 接受 aabb 吗 ? 
b € 
a mie Se 
: 2 a 
a, b a b 


a, b 





图 3-28 接受 (alb) “abb 的 DFA 图 3-29 练习 3.6.3 的 NFA 


练习 3. 6'4: 对 于 图 3-30 的 NFA, 重复 练习 3. 6.3。 
练习 3. 6. 5: 给 出 如 下 练习 中 的 NFA 的 转换 表 : 
1) 练习 3.6.3. 

2) FY 3.6.4. 

3) R326. 


3.7 ”从 正则 表达 式 到 自动 机 


就 像 3.5 节 的 内 容 所 介绍 的 , 正则 表达 式 非常 图 3.30 练习 3.6.4 的 NFA 
适合 描述 词法 分 析 器 和 其 他 模式 处 理 软件 。 然 而 
那些 软件 的 实现 需要 像 算法 3-18 中 那样 来 模拟 DFA 的 执行 , 或 者 模拟 NFA 的 执行 。 由 于 NFA 
对 于 一 个 输入 符号 可 以 选择 不 同 的 转换 ( 如 在 图 3-24 中 的 状态 0 上 输入 为 a 时 ), 它 还 可 以 执行 
输入 e 上 的 转换 (如 在 图 3-26 中 的 状态 EN), 甚至 可 以 选择 是 对 e 或 是 对 真实 的 输入 符号 执 
行 转换 , 因此 对 NFA 的 模拟 不 如 对 DFA 的 模拟 直接 。 于 是 , 我 们 需要 将 一 个 NFA 转换 为 一 个 识 
别 相 同 语言 的 DFA, 

这 一 节 我 们 将 首先 介绍 如 何 把 NFA 转化 为 DFA。 然 后 , 我 们 利用 这 种 称 为 “ 子 集 构造 法 "的 
技术 给 出 一 个 直接 模拟 NFA 的 算法 。 这 个 算法 可 用 于 那些 将 NFA 转化 到 DFA 比 直接 模拟 NFS 
更 加 耗 时 的 ( 非 词法 分 析 的 ) 情形 。 接 着 ,我 们 将 说 明 如 何 把 正则 表达 式 转换 为 NFA, 在 必要 时 
可 以 根据 这 个 NEA 构造 出 一 个 DFA。 最 后 我 们 讨论 了 不 同 的 正则 表达 式 实现 技术 之 间 的 
时 间 -空间 权衡 问题 , 并 说 明 如 何 为 具体 的 应 用 选择 合适 的 方法 。 

3.7.1 从 NFA 到 DFA 的 转换 

子 集 构造 法 的 基本 思想 是 让 构造 得 到 的 DFA 的 每 个 状态 对 应 于 NFA 的 一 个 状态 集合 。DFA 
在 读 人 输入 ajara, 之 后 到 达 的 状态 对 应 于 相应 NFA 从 开始 状态 出 发 ， 沿 着 以 aiaz…an 为 标 
号 的 路 径 能 够 到 达 的 状态 的 集合 。 

DFA 的 状态 数 有 可 能 是 NFA 状态 数 的 指数 , 在 这 种 情况 下 , 我 们 在 试图 实现 这 个 DFA 时 
会 遇 到 困难 。 然 而 , 基于 自动 机 的 词法 分 析 方法 的 处 理 能 力 部 分 源 于 如 下 事实 : 对 于 一 个 真 
实 的 语言 , 它 的 NFA 和 DFA 的 状态 数量 大 致 相同 ,状态 数量 呈 指 数 关系 的 情形 尚未 在 实践 中 
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出 现 过 。 
由 NFA 构造 DFA 的 子 集 构 造 (subset construction ) 算法 。 

输入 ; 一 个 NEA N, 

输出 : 一 个 接受 同样 语言 的 DFA D。 

方法 : 我 们 的 算法 为 DD 构造 一 个 转换 表 Diran。D 的 每 个 状态 是 一 个 NFA 状态 集合 , 我 们 将 
构造 Dtran, 使 得 D“ 并 行 地 ”模拟 N 在 遇 到 一 个 给 定 输入 串 时 可 能 执行 的 所 有 动作 。 我 们 面 对 的 
第 一 个 问题 是 正确 处 理 N 的 转换。 在 图 3-31 中 我 们 可 以 看 到 一 些 函 数 的 定义 。 这 些 函 数 描述 
了 一 些 需要 在 这 个 算法 中 执行 的 N 的 状态 集 上 的 基本 操作 。 请 注意 , s 表示 NV 的 单个 状态 , 而 7 
代表 N 的 一 个 状态 集 。 









PC CO eee 
dn 


能 够 从 NFA 的 状态 s 开始 只 通过 e 转 换 到 达 的 NFA 状态 集合 


E-closure(T) | 能 够 从 T 中 某 个 NFA 状 态 s 开 始 只 通过 e 转换 到 达 的 NFA 
状态 集合 , Hl User e-closure(s) 


能 够 从 T PENRE 出 发 通过 标号 为 的 转换 到 达 的 
NFA 状 态 的 集合 













move(T, a) 





图 3-31 NFA 状态 集 上 的 操作 


我 们 必须 找 出 当 立 读 和 人 了 某 个 输入 串 之 后 可 能 位 于 的 所 有 状态 集合 。 首先 , 在 读 人 第 一 
个 输入 符号 之 前 , NN 可 以 位 于 集合 e-closure( so) 中 的 任何 状态 上 , 其 中 so 是 入 的 开始 状态 。 下 
面 进行 归纳 。 假 定 N ERAMA P x 之 后 可 以 位 于 集合 7 中 的 状态 上 。 如 果 下 一 个 输入 符号 
是 a, 那么 和 可 以 立即 移动 到 集合 move( 7, a) 中 的 任何 状态 。 然 而 ， 放 可 以 在 读 人 4a 后 再 执行 
JLS e fett, 因此 WW 在读 入 xa 之 后 可 位 于 e-closure( move( T, a) ) 中 的 任何 状态 上 。 根 据 这 些 
思想 , 我 们 可 以 得 到 图 3-32 中 显示 的 方法 ， 该 方法 构造 了 DD 的 状态 集合 Dstates 和 也 的 转换 函 
数 Diran。 


一 开始 , e-closure(so) 是 Dstates 中 的 唯一 状态 , 且 它 未 加 标记 ; 
while (在 Dstates 中 有 一 个 未 标记 状态 T ) { 
给 了 T 加 上 标记 ; 
for ( 每 个 输入 符号 a ) { 


U = e-closure(move(T, a)); 


if ( U AE Dstatest} 
将 U 加 入 到 Dstates 中 , 且 不 加 标记 ; 
Dtran{T, a] = U; 





图 3-32， 子 集 构造 法 

D 的 开始 状态 是 e-closure( so) , D 的 接受 状态 是 所 有 至 少 包含 了 WN 的 一 个 接受 状态 的 状态 集 

合 。 我 们 只 需要 说 明 如 何 对 NFA 的 任何 状态 集合 7 计算 e-closure(7) ,就 可 以 完整 地 描述 子 集 构 

造 法 。 这 个 计算 过 程 显示 在 图 3-33 中 。 它 是 从 一 个 状态 集合 开始 的 一 次 简单 的 图 搜索 过 程 ， 不 

过 此 时 假设 这 个 图 中 只 存在 标号 为 < 的 边 。 oO 

Gil 3, 21 图 3-34 给 出 了 另 一 个 接受 语言 (alb) "abb 的 NFA。 它 正好 是 我 们 将 在 3 7 节 中 根据 
这 个 正则 表达 式 直接 构造 得 到 的 NFA。 我 们 现在 把 算法 3. 20 应 用 到 图 3.34 H, 
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将 T 的 所 有 状态 压 入 3tack 中 ; 
将 e-closure(T) 初始 化 为 T; 
while ( stack 非 空 ) { 
将 栈 顶 元 素 ! 弹 出 栈 中 ; 
for (每 个 满足 如 下 条 件 的 吧 : 从 t 出 发 有 一 个 标号 为 的 转换 到 达 状 态 4) 
if ( u PE e-closure( 了 T) 中 ) { 
将 4 加 入 到 e-closure(T) 中 ; 
将 & 压 入 栈 中 ; 





} 





图 3-33 ”计算 e-closure(7) 


等 价 NFA 的 开始 状态 4 是 e-closure(0), 即 4=10;1,2;4， T} o A 中 的 状态 就 是 能 够 从 状态 
0 出 发 , 只 经 过 标号 为 e 的 路 径 到 达 的 所 有 状态 。 WER, 因为 路 径 可 以 不 包含 边 , 所 以 状态 0 
也 是 可 以 从 它 自身 出 发 经 过 标号 为 e 的 路 径 到 达 的 状态 。 

NFA 的 输入 字母 表 是 1a, 中 。 因 此 , 我 们 的 第 一 步 是 标记 4， 并 计算 Diran[ A, a] = e-closure 
(move(A, a) ) 以 及 Diran[ A, b] = €-closure(move(A, b)) > 在 状态 0s 1.2.4.7 中 , 只 有 2 和 7 有 
ga 上 的 转换 , 分 别 到 达 状 态 3 和 8, 因此 move(A, a) = 13, 8}, 同时 e-closure({3, 8}) = 11,2， 
3, 4, 6, 7, 8} 。 因 此 我 们 有 : 


Dtran{A, a] = e-closure(move(A,a)) = e-closure({3, 8}) = {1, 2,3, 4,6, 7, 8} 
我 们 称 这 个 集合 为 B, 得 到 Diran[ A, a] = B, 





图 3-34 (alb)“abb 对 应 的 NFA N 


现在 我 们 要 计算 Diran[4, bls ÆA 的 状态 中 只 有 4 有 一 个 输入 5 上 的 转换 , EIERS S, 

因此 
Dtran{A, b] = e-closure({5}) = {1, 2, 4, 6, 7} 

我 们 称 这 个 集合 为 C, 因此 Diran[ A, 5] =C. 

如 果 我 们 对 未 加 标记 的 集合 B 和 C 继续 这 个 处 理 过 
程 , 最 终 会 使 得 这 个 DFA 的 所 有 状态 都 被 加 上 标记 。 这 个 
结论 一 定 正确 , 因为 11 个 NFA 状态 的 集合 只 有 21 个 子 | 023,46,78) 
集 、 我 们 实际 上 构造 出 5 个 不 同 的 DFA 状态 。 这 些 状态 、 | 448879) 
它们 对 应 的 NFA 状态 集 以 及 DD 的 转换 表 显示 在 图 3-35 中 。 | {125.6,7,10} 
D 的 转换 图 如 图 3-36 所 示 。 状 态 4 Æ D 的 开始 状态 , 而 包 图 3.35，DFA DD 的 转换 入 Divan 
Ay NFA 状态 10 的 EE 状态 是 唯一 的 接受 状态 。 
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请 注意 , 相 比 图 3-28 中 接受 相同 语言 (alb) * abb 的 DPA, 这 个 DFA D 多 了 一 个 状态 。D 的 
状态 4 和 C 具有 同样 的 转换 函数 , 因此 可 以 被 合并 。 我 们 将 在 3.9.6 中 讨论 使 一 个 DFA 的 状态 
个 数 最 小 化 问题 。 口 
3.7.2 NFA 的 模拟 b 

许多 文本 编辑 程序 使 用 的 策略 是 根据 一 个 正则 
表达 式 构造 出 相应 的 NFA, 然后 使 用 类 似 于 on-the- 
fly( 即 边 构造 边 使 用 的 ) 的 子 集 构造 法 来 模拟 这 个 
NFA 的 执行 。 这 种 模拟 执行 方法 将 在 下 面 给 出 。 
模拟 一 个 NFA 的 执行 。 

输入 : 一 个 以 文件 结束 符 eof 结尾 的 输入 串 
to 一 个 NFA N, 其 开始 状态 为 so， 接受 状态 集 为 a 
下 ,转换 函数 为 moveo 图 3-36 ”将 子 集 构造 法 应 用 于 图 3-34 的 结果 

输出 : 如 果 NEAR x 则 返回 “yes”， AWE“ no” 

方法 : 这 个 算法 保存 了 一 个 当前 状态 的 集合 S, 即 那 些 可 以 从 so 开始 沿 着 标号 为 当前 已 读 入 
输入 部 分 的 路 径 到 达 的 状态 的 集合 。 如 果 。 是 函数 nexiChar( ) 读 到 的 下 一 个 输入 字符 , WARN 
首先 计算 movel S, c), 然后 使 用 e-closure 求 出 这 个 集合 的 闭 包 。 该 算法 的 思想 如 图 3-37 所 示 。 

Gl 





3.7.3 NEFA 模拟 的 效率 

如 果 精 心 实 现 ,， 算法 3.22 可 以 相当 高 效 。 因 为 这 些 
高 效 实现 的 思想 可 以 用 于 许多 涉及 图 搜索 的 算法 。 我 们 将 
更 详细 地 介绍 这 个 实现 。 我 们 需要 的 数据 结构 包括 : 

1) 两 个 堆栈 , 其 中 每 一 个 堆栈 都 存放 了 一 个 NFA 状 
态 集合 。 其 中 的 一 个 堆栈 oldStates 存放 “当前 状态 集合 ”， 
即 图 3-37 的 第 4 行 中 右边 的 $ 的 值 。 另 一 个 堆栈 newStates 
存放 了 “下 一 个 ”状态 集合 ,， 即 第 4 行 中 左边 的 5 的 值 。 在 i 
我 们 运行 第 3 行 到 第 6 行 的 循环 时 , 中 间 的 一 个 步骤 没有 在 图 3-37 中 列 出 , 即 把 newStates 的 值 转 
移 到 oldStates 中 去 的 步骤 。 

2) 一 个 以 NFA 状态 为 下 标的 布尔 数组 alreadyOn。 它 指示 出 哪个 状态 已 经 在 newStates 中 。 
虽然 这 个 数组 存放 的 信息 和 栈 中 存放 的 信息 相同 ,但 查询 alreadyOn[s] 要 比 在 栈 newStates 中 查询 
s 快 很 多 。 我 们 同时 保持 两 种 表示 方法 的 原因 就 是 为 了 获得 这 个 效率 。 

3) 一 个 二 维 数组 move[s, a], 它 保存 这 个 NFA 的 转换 表 。 这 个 表 中 的 条 目 是 状态 的 集合 ， 
它们 用 链表 表示 。 

为 了 实现 图 3-37 的 第 一 行 , 我 们 需要 将 alreadyOn 数 


S = e-closure(so); 

c= nextChar(); 

while ( c!= eof ) { 
S = €-closure(move(S,c)); 
c= nextChar(); 


} 
if( SOF !=@) return "yes"; 
else return "no"; 





ONDU eH 
SS NS aS OS wa 


addState(s) { 


组 中 的 所 有 条 目 都 设置 为 FALSE, 然后 对 于 e-closure( so) 10 将 8 压 和 人 栈 newsStates 中 ; 
中 的 每 个 状态 s, 将 s 压 入 oldStates 并 设置 alreadyOnls] 为 eyed bl aa 4) 
TRUB。 这 个 对 状态 的 操作 以 及 图 3-37 第 4 行 中 的 操作 ， if ( lalreadyOn{t} ) 


addState(t); 


都 可 以 使 用 函数 cdaSiate(s) 来 实现 。 这 个 函数 将 HEA 
newStates, 4% alreadyOn [| s ] 设置 为 TRUE， 并 使 用 
move[s, e] 作 为 参数 递归 地 调用 自身 ,继续 计算 图 3-38 ”加 入 一 个 不 在 newStates 
e-closure(s) 的 值 。 然 而 ;为 了 避免 重复 王 作 , 我 们 必须 小 中 的 新 状态 
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b, 不 要 对 一 个 已 经 在 栈 newStates 中 的 状态 调用 addSiate。 图 3-38 给 出 了 这 个 函数 的 概要 。 

我 们 通过 查看 oldStates 中 的 每 个 状态 s 来 实现 图 3-37 的 第 4 行 。 我 们 首先 找 出 状态 集合 
move[s, c], 其 中 < 是 下 一 个 输入 字符 。 对 于 那些 不 在 newStates 栈 中 的 状态 , 我 们 应 用 函数 
addState。 注 意 , addState 还 计算 了 一 个 状态 的 e-closure 值 ， 并 把 其 中 的 状态 一 起 加 入 到 newStates 
中 (如 果 这 些 状态 不 存在 的 话 ) 。 这 一 系列 处 理 步 又 如 图 3-39 所 示 。 

假定 一 个 NEA 有 个 状态 和 m 个 转换 , 即 m 是 离开 
名 个 状态 的 转 效 数 的 总 和 。 如 果 不 包括 第 19 Feett | a RNA 
addState 的 调用 , 在 第 16 行 到 第 21 行 的 循环 上 花费 的 时 间 i if ( aretoa) 

是 0(n)。 也 就 是 说 , 我 们 最 多 需要 运行 这 个 循环 nn 遍 , H 将 s 弹 出 oldStates 粳 ; 
如 果 不 考 虑 调用 addState 所 花费 的 时 间 , 每 一 遍 的 工作 量 


都 是 常数 。 对 于 第 22 行 到 第 26 行 的 循环 , 这 个 结论 也 | 22) for (newStates 中 的 每 个 8) { 
成 立 将 s 弹 出 newStates 栈 ; 
ae 将 s 压 入 oldStates 栈 ; 
在 图 3-39 的 一 次 执行 中 ( 即 图 3-37 的 第 4 行 ), 对 于 alreadyOnls] = FALSE; 


任意 给 定 的 状态 最 多 只 能 调用 addState 一 次 。 原 因 在 于 每 
次 调用 addState (s) 时 都 会 在 图 3-38 的 第 11 行 上 把 
alreadyOn[s] 置 为 TRUE。 一 旦 alreadyOn[s] 设 为 TRUE, 图 
3-38 的 第 13 行 和 图 3-39 的 第 18 行 就 会 禁止 再 次 调用 addState(s) 。 

如 果 不 考虑 第 14 行 中 的 递归 调用 所 花费 的 时 间 , 第 10 行 、 第 11 行 对 addState 的 一 次 调用 所 
花 的 时 间 为 0(1) ,第 12、13 行 的 时 间 取决 于 有 多 少 e 转换 离开 s。 对 于 一 个 给 定 的 状态 , 我 们 不 
知道 这 个 数目 是 多 少 , 但 是 我 们 知道 最 多 只 有 m 个 离开 各 个 状态 的 转换 。 因 此 , 在 图 3-39 中 代 
码 的 一 次 执行 中 , 在 第 12 行 和 13 行 上 用 于 调用 addState 的 累计 时 间 为 O(m) 。 花 费 在 addState 
的 其 他 步骤 的 累计 时 间 为 0(n), 因为 每 一 次 调用 的 时 间 是 一 个 常数 , 且 最 多 只 有 次 调用 。 

因此 我 们 可 以 得 出 如 下 结论 ， 即 只 要 实现 方法 得 当 , 执行 图 3-37 的 第 4 行 的 时 间 是 
0(n+m)。 从 第 3 行 到 第 6 行 的 while 循环 的 其 余部 分 在 每 次 迭代 时 花费 0(1) 时 间 。 如 果 输 入 x 
的 长 度 为 , 那么 该 循环 的 总 工作 量 为 0(k(n+m) ) 。 图 3-37 的 第 1 行 的 执行 时 间 为 O(n +m), 
因为 它 实际 上 就 是 图 3-39 中 的 各 个 步骤 ,只 不 过 oldStates 中 只 包含 状态 so。 第 2、7、8 行 都 花费 
0(1) 时 间 。 因 此 ,如 果实 现 正 确 , 算法 3. 22 的 运行 时 间 为 0(k(n+m))。 也 就 是 说 ， 该 算法 所 
需 时 间 和 输入 串 的 长 度 和 转换 图 的 大 小 ( 结 点 数 加 上 边 数 ) 的 乘积 成 正比 。 





图 3-39 图 3-37 中 第 4 步 的 实现 





大 O 表 示 法 
形 如 0(n) 的 表达 式 是 “最 多 某 个 常数 乘 以 n” 的 缩写 。 从 技术 上 讲 , 我 们 说 一 个 函数 fn) 
是 0(g(n) ) 的 条 件 是 存在 常量 和 no 使 得 当 n 二 no 时 必然 有 f(n) <cg(n)。 这 里 的 f(n) 可 
能 是 一 个 算法 的 某 些 步骤 的 运行 时 间 。 一 个 有 用 的 写法 是 “0(1)”, 它 表示 “ 某 个 常量 ”。 使 
用 大 0 表示 法 可 以 使 得 我 们 不 需要 过 多 地 考虑 使 用 什么 样 的 运行 时 间 单 位 来 进行 度量 , 而 仍 
然 可 以 表示 一 个 算法 的 运行 时 间 的 增长 速度 。 











3.7.4 ”从 正则 表达 式 构 造 NFA 

现在 我 们 给 出 一 个 算法 , 它 可 以 将 任何 正则 表达 式 转变 为 接受 相同 语言 的 NFA。 这 个 算法 
是 语法 制导 的 , 也 就 是 说 它 沿 着 正则 表达 式 的 语法 分 析 树 自 底 向 上 递归 地 进行 处 理 。 对 于 每 个 
TRAR, 该 算法 构造 一 个 只 有 一 个 接受 状态 的 NFA。 
将 正则 表达 式 转 换 为 一 个 NFA 的 McMaughton-Yamada-Thompson 算法 。 


词法 分 析 ai 





输入 : 字母 表 上 的 一 个 正则 表达 式 7。 

输出 : 一 个 接受 L(7r) 的 NFA N, 

方法 : 首先 对 7 进行 语法 分 析 , 分 解 出 组 成 它 的 子 表达 式 。 构 造 一 个 NFA 的 规则 分 为 基本 规 
则 和 归纳 规则 两 组 。 基 本 规则 处 理 不 包含 运算 符 的 子 表达 式 , 而 归纳 规则 根据 一 个 给 定 表达 式 
的 直接 子 表达 式 的 NFA 构造 出 这 个 表达 式 的 NFA, 

基本 规则 : 对 于 表达 式 e, 构造 下 面 的 NFA, 

start © € © 
这 里 , i 是 一 个 新 状态 , 也 是 这 个 NFA 的 开始 状态 ; f 是 另 一 个 新 状态 , 也 是 这 个 NFA 的 接 
对 于 字母 表 中 的 子 表达 式 a, 构造 下 面 的 NFA, 
start 
OG) 

同样 , i 和 _f 都 是 新 状态 , 分 别 是 这 个 NFA 的 开始 状态 和 接受 状态 。 请 注意 , 在 这 两 个 基本 
构造 规则 中 , HF e REN a 的 作为 r 的 子 表 达 式 的 每 次 出 现 ， 我 们 都 会 使 用 新 状态 分 别 构造 出 
一 个 独立 的 NEFA。 

归纳 规则 : 假设 正则 表达 式 * Ale 的 NFA 分 别 为 N(s) 和 NN(1)。 

1) 假设 r=sli, r9 NFA, BINC), 可 以 按照 图 3-40 中 的 方式 构造 得 到 。 这 里 ; 和 j 是 新 状 
E, 分 别 是 N(7) 的 开始 状态 和 接受 状态 。 从 i 到 N(s) 和 N(z) 的 开始 状态 各 有 一 个 转换 ， 从 
N(s) 和 (zt) 到 接受 状态 /也 各 有 一 个 转换 。 请 注意 , W(s) MNO 的 接受 状态 在 W(r) 中 不 是 
接受 状态 。 因 为 从 i 到 /的 任何 路 径 要 么 只 通过 N(s) , 要么 只 通过 (1), KRF i 或 进入 /的 e 
转换 都 不 会 改变 路 径 上 的 标号 , 因此 我 们 可 以 判定 W(r) 识 别 Ls) UL(t) ,也 就 是 L(r)。 也 就 是 
说 , 图 3-40 中 的 NFA 是 一 个 正确 的 处 理 并 运算 符 的 构造 。 

2) BL r= st, 然后 按照 图 3-41 所 示 构 造 N(r) 。N(s) 的 开始 状态 变 成 了 N(7) 的 开始 状态 。 
NN() 的 接受 状态 成 为 N(7) 的 唯一 接受 状态 。N(s) 的 接受 状态 和 N(1) 的 开始 状态 合并 为 一 个 状 
E, 合并 后 的 状态 拥有 原来 进入 和 离开 合并 前 的 两 个 状态 的 全 部 转换 。 图 3-41 中 一 条 从 i 到 /的 
路 径 必须 首先 经 过 N(s)， 因 此 这 条 路 径 的 标号 以 5(s) 中 的 某 个 串 开始 。 然后 ,这 条 路 径 继续 通 
过 (2)， 因 此 这 条 路 径 的 标号 以 二 切中 的 某 个 串 结束 。 就 像 我 们 很 快要 论证 的 ， 没有 转换 离开 
构造 得 到 的 接受 状态 , 也 没有 转换 进入 开始 状态 , 因此 一 个 路 径 不 可 能 在 离开 N(s) 后 再 次 进入 
N(s)。 因 此 , N(7) 愉 好 接受 L(s)L(1) , 它 是 r=st 的 一 个 正确 的 NFA, 





KEON, 


图 3-40 两 个 正则 表达 式 的 并 的 NFA 图 3-41 ”两 个 正则 表达 式 的 连接 的 NFA 


3) 假设 r=s* , 然后 为 + 构造 出 图 3-42 所 示 的 NFA N(7)。 这 里 , i 和 /是 两 个 新 状态 , 分 别 
是 N(7) 的 开始 状态 和 唯一 的 接受 状态 。 要 从 i 到达/ 我 们 可 以 沿 着 新 引入 的 标号 为 6 的 路 径 前 
HE, 这 个 路 径 对 应 于 L(s)" 中 的 一 个 串 。 我 们 也 可 以 到 达 NC) 的 开始 状态 , 然后 经 过 该 NFA, 再 
零 次 或 多 次 从 它 的 接受 状态 回 到 它 的 开始 状态 并 重复 上 述 过 程 。 这 些 选项 使 得 W(r) 可 以 接受 


102 $3 





L(s)!, LC)? 等 集合 中 的 所 有 串 ， 因 此 N(r) 识 别 的 所 有 串 的 集合 就 是 上 Cs)“。 


4) 最 后 , 假设 "= (s), 那么 L(7) =L(s), e 
我 们 可 以 直接 把 N(s) 当 作 N(7)。 口 per hie Ny 
算法 3.23 PRUNET- ERER, LOKO o> © 


说 明 为 什么 这 个 归纳 性 构造 方法 能 够 得 到 正确 
的 解答 。 我 们 不 会 给 出 正式 的 正确 性 证 明 。 但 
除了 最 重要 的 性 质 , 即 N(7) 接受 语言 L(7) 之 外 ， < 
我 们 还 在 下 面 列 出 一 些 由 该 算法 构造 得 到 的 
NFA 所 具有 的 性 质 。 这 些 性 质 本 身 也 很 有 趣 ， 并 
且 有 助 于 正式 证 明 这 个 方法 的 正确 性 。 

D N(7) 的 状态 数 最 多 为 中 出 现 的 运算 符 和 运算 分 量 的 总 数 的 2 倍 。 得 出 这 个 上 界 的 原因 
是 算法 的 每 一 个 构造 步 又 最 多 只 引入 两 个 新 状态 。 

2) N(r) 有 且 只 有 一 个 开始 状态 和 一 个 接受 状态 。 接 受 状态 没有 出 过 , 开始 状态 没有 人 边 。 

3) N) 中 除 接受 状态 之 外 的 每 个 状态 要 么 有 一 条 其 标号 为 三 中 符号 的 出 边 , 要 么 有 两 条 标 
号 为 e 的 出 边 。 
DEEI 计 我 们 用 算法 3. 23 为 正则 表达 式 7= (alb) ”abb 构造 一 个 NFA。 图 3- 和 3 显示 了 
的 一 棵 语法 分 析 树 , 这 棵 树 和 2. 2. 3 节 中 构造 的 算术 表达 式 的 语法 分 析 树 相似 。 对 于 子 表达 式 
r, 即 第 一 个 a, 我 们 构造 如 下 的 NFA: 

start 


我 们 在 选择 这 个 NEA 中 的 状态 编号 时 考虑 了 和 接 下 来 生成 的 NFA 的 状态 编号 之 间 的 一 至 


性 。 对 7 构造 如 下 NFA: 
start 
一 -人 一 一 


现在 我 们 可 以 使 用 图 3-40 中 的 构造 方法 , 将 N(r1) 和 NN(r,) 合 并 , 得 到 73 = ri 17 AY NFA, 
这 个 NFA 显示 在 图 3-44 中 。 

FIRS r, = (r3) AY NFA 和 7 AY NFA 相同 。 子 表达 式 r; = (r3) * AY NFA 的 构造 如 图 3-45 
所 示 。 我 们 使 用 图 3-42 所 示 的 方法 根据 图 3-44 中 的 NFA 构造 出 这 个 NFA。 


图 3-42 一 个 正则 表达 式 的 闭 包 的 NFA 
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图 3-43 (alb) “abb 的 语法 分 析 树 3-44 r, i) NFA 
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HEZE r, 它 是 表达 式 中 的 另 一 个 a。 我 们 再 次 对 a4 使 用 基本 构造 法 , 但 是 必须 使 用 新 的 
RA. BA r 和 是 相同 的 表达 式 , 但 这 个 构造 方法 不 允许 我 们 复 用 那个 为 构造 的 NFA。r6 
的 NFA 如 下 : 

start 
© 

要 得 到 rj =rsr6 的 NFA, 我 们 应 用 图 3-41 中 的 构造 方法 ,将 状态 7 和 7’ 合 并, 得 到 如 图 3:46 
所 示 的 NFA。 按 照 这 个 方法 继续 构造 出 两 个 分 别名 为 re 和 mo 对 应 于 子 表达 式 & 的 新 NFA, 最 
后 构造 出 如 图 3-34 所 示 的 (alb)* abb 的 NFA, oO 





图 3-45 r, 的 NFA he Bd ae 


3.7.5 字符 囊 处 理 算法 的 效率 

我 们 看 到 , 算法 3. 18 能 在 OC 1x1) 时 间 内 处 理 字符 串 x, 而 在 3. 7. 3 节 中 我 们 提 到 , 要 模拟 一 
个 NEA 的 运行 所 需 的 时 间 与 1z1 和 该 NFA 的 转换 图 的 大 小 的 乘积 成 正比 。 很 明显 , 用 DFA 来 模 
拟 比 用 NFA 模拟 更 快 , 因此 我 们 可 能 会 怀疑 模拟 一 个 NFA 到 底 有 没有 意义 。 

支持 使 用 NFA 模拟 的 论据 之 一 是 子 集 构造 法 在 最 坏 的 情况 下 可 能 会 使 状态 个 数 呈 指数 增长 。 虽 
然 原则 上 DFA 的 状态 数 不 会 影响 算法 3. 18 的 运行 时 间 , 但 是 假如 状态 数 大 到 一 定 程度 ,以 至 于 转换 表 
超过 了 主 存 容量 时 , 那么 真正 的 运行 时 间 就 必须 加 上 磁盘 读 写 时 间 , 从 而 使 运行 时 间 显 著 增加 。 
考虑 形 如 L = (alb)*a(alb)"-! 的 正则 表达 式 所 描述 的 语言 族 。 也 就 是 说 ， 每 个 语 
言 三 包含 了 所 有 由 a 和 5 组 成 且 从 右 端 向 左 数 第 n 个 符号 是 a 的 串 。 很 容易 构造 出 一 个 具有 
n+1 个 状态 的 NFA。 它 在 任何 输入 符号 上 都 可 以 停留 在 其 初始 状态 , 但 是 当 输 入 为 a 时 也 可 以 
到 达 状态 1。 在 处 于 状态 1 时 , 它 在 任何 输入 符号 上 都 会 转 到 状态 2, 以 此 类 推 ， 当 到 达 状态 ”时 
它 接受 输入 串 。 图 3-47 给 出 了 这 个 NFA。 


a 
start A, a © a, b © d PEIN eGD i a, b © 


b 
图 3-47 一 个 NFA, 它 的 状态 数量 远 小 于 等 价 的 最 小 DFA 的 状态 数 
然而 , Lu 的 任何 一 个 DFA 都 至 少 有 2" 个 状态 。 我们 不 证 明 这 个 结论 , 只 说 明 其 基本 思想 。 
假设 两 个 长 度 均 为 的 串 到 达 DFA 的 同一 个 状态 , 必然 存在 一 些 位 置 使 得 两 个 串 在 这 些 位 置 上 
的 符号 不 同 (必然 一 个 是 a 而 另 一 个 是 2)。 我 们 考虑 最 后 一 个 这 样 的 位 置 。 我 们 可 以 不 断 把 相 
同 的 符号 同时 添加 到 这 两 个 串 的 后 面 , 直到 它们 的 最 后 n -1 个 位 置 上 的 符号 串 相 同 , 但 是 倒数 
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第 nn 个 位 置 上 的 符号 不 同 。 那么 这 个 DPA 在 处 理 这 两 个 (经 过 扩展 的 ) 符号 串 时 会 到 达 同 一 个 状 
态 (因为 根据 假设 , 此 DPA 在 处 理 未 经 扩展 的 两 个 串 时 到 达 同 一 个 状态 ,而 对 这 两 个 串 的 扩展 方 
么 同时 接受 这 两 个 符号 串 ， 要 么 都 不 接受 这 两 个 符号 串 。 
(注意 这 两 个 符号 目的 倒数 第 ”个 符号 是 不 同 的 ,它们 应 该 有 且 只 有 一 个 串 在 这 个 语言 中 , 由 此 
得 出 矛盾 。 这 说 明 任 意 两 个 长 度 为 n 的 不 同 符号 串 应 该 到 达 不 同 的 状态 。 而 长 度 为 n 的 符号 串 
共有 2" 个 , 也 就 是 说 至 少 要 有 2" 个 状态 一 译 者 注 ,) 幸 运 的 是 , 如 我 们 前 面 提 到 的 ,词法 分 析 
很 少 需 要 处 理 这 种 类 型 的 模式 , 我 们 也 不 用 担心 会 遇 到 状态 数量 出 奇 多 的 DFA。 Oo 

然而 , 词法 分 析 器 生成 工具 和 其 他 字符 串 处 理 系统 经 常 以 正则 表达 式 作为 输入 。 我 们 面临 着 将 
正则 表达 式 转换 成 DFA 还 是 NFA 的 问题 。 转 换 成 DFA 的 额外 开销 是 在 将 算法 3.20 应 用 于 转换 得 
到 的 NFA 而 产生 的 开销 (也 可 以 将 一 个 正则 表达 式 直接 转化 为 DPA, 但 工作 量 实质 上 是 一 样 的 ) 。 
如 果 字 符 申 处 理 器 被 频繁 使 用 ,比如 词法 分 析 器 ,那么 转换 到 DIA 时 付出 的 任何 代价 都 是 值得 的 。 
然而 在 另 一 些 字符 串 处 理应 用 中 ,例如 grep, 用 户 指定 一 个 正则 表达 式 , 并 在 一 个 或 多 个 文件 中 搜 
索 这 个 表达 式 所 描述 的 模式 , 那么 跳 过 构造 的 DFA 步骤 直接 模拟 NFA 可 能 更 加 高 效 。 

现在 我 们 考虑 用 算法 3.23 把 正则 表达 式 7 转换 成 相应 的 NFA 的 代价 。 其 关键 步骤 是 构造 ， 
的 语法 分 析 树 。 在 第 4 章 中 我 们 会 看 到 几 种 可 以 在 线性 时 间 内 构造 语法 分 析 树 的 方法 ， 即 在 
0( Ir|) 时 间 内 完成 语法 分 析 树 的 构造 , 其 中 Irl 表 示 r 的 大 小 , 也 就 是 r 中 运算 符 和 运算 分 量 的 总 
和 。 我们 也 很 容易 发 现 每 次 应 用 算法 3.23 中 的 基本 规则 和 归纳 规则 只 需要 常数 时 间 ,， 因 此 转换 
得 到 一 个 NFA 所 花费 的 全 部 时 间 是 0( 171)。 

此 外 , 如 我 们 在 3.7.4 节 中 观察 到 的 ,构造 得 到 的 NFA 最 多 有 21rl 个 状态 和 41rl 个 转换 。 也 
就 是 说 , 根据 3.7.3 节 中 的 分 析 , 可 以 得 到 an<21rl 和 m<41rl。 因 此 , 模拟 这 个 NFA 处 理 输入 字 
RE x 的 过 程 所 花费 时 间 是 0( Ir x Ix1)。 这 个 时 间 远 远 超过 构造 NFA 所 用 的 时 间 OC 1r1) 。 因 
此 , 我 们 得 到 ,对 于 正则 表达 式 r+ 和 字符 串 *， 能 够 在 OC Irl x lx1) 时 间 内 判断 * ESAF LC) o 

子 集 构造 法 所 花费 的 时 间 很 大 程度 上 取决 于 构造 得 到 的 DFA 的 状态 数 。 首 先 注 意 在 图 3-22 
所 示 的 子 集结 构 法 中 , 算法 的 关键 步骤 , 即 根据 状态 集 7 和 输入 符号 a 构建 状态 集 U 的 过 程 与 算 
法 3. 22 的 NFA 模拟 方法 中 根据 旧 状 态 集 构造 新 状态 集 的 过 程 类 似 。 我 们 已 经 知道 , 如 果实 现 得 
当 , 这 个 步 又 所 花 的 时 间 最 多 和 NFA 状态 数 与 转换 数 之 和 成 正比 。 

假设 我 们 要 从 一 个 正则 表达 式 r 开始 ,并 将 它 构造 成 一 个 NFA。 这 个 NFA 最 多 有 21rl 个 状 
态 和 41rI 个 转换 ,并且 最 多 有 21rl 个 输入 符号 。 因 此 , 对 于 每 个 构造 得 到 的 DFA 状态 , 我 们 最 多 
必须 构造 1rl 个 新 状态 , 构造 每 个 新 状态 最 多 花费 0(21r1 +41r1) 时 间 。 因 此 , 构造 一 个 有 个 状 
态 的 DFA 所 用 的 时 间 为 OC Irl?s) 。 

在 通常 情况 下 , s KASTI, 上 面 的 子 集 构造 法 
需要 的 时 间 为 Ori), AT, 在 如 例 3.25 所 示 的 最 
坏 情况 下 , 这 个 时 间 是 0( 1r1?2'"1) 。 当 我 们 需要 构造 
一 个 识别 器 来 指明 一 个 或 多 个 串 是 否 在 一 个 给 定 的 
正则 表达 式 > 所 定义 的 L(7) 中 时 , 我们 有 多 个 选 顺 。 ws oe 识别 一 个 正则 表 迪 式 所 表示 的 
图 3-48 对 这 些 选项 作 了 总 结 。 语言 的 不 同方 法 所 具有 的 初始 开销 和 

如 果 处 理 各 个 字符 串 所 花 的 时 间 多 很 多 ,比如 人 
我 们 构造 词法 分 析 器 时 面临 的 情况 ,我们 显然 倾向 
于 使 用 DFA。 然 而 , TEAR grep 这 样 的 命令 中 , 我 们 只 会 对 一 个 符号 串 运行 这 个 自动 机 。 此 时 我 们 
通常 倾向 于 使 用 NFA 方式 。 只 有 当 1x1 接 近 Irl3 的 时 候 , 我 们 才 会 考虑 转换 到 DFA, 

还 有 一 种 混合 策略 可 以 做 到 对 每 个 正则 表达 式 MAAR x, 它 的 效率 总 是 和 DFA 和 NFA 








| 自动 机 | 初始 开销 | 每 人 曲 的 开销 | 


NFA O(lr|) El x |z|) 
DFA typical case | O(|r|*) O((|z|) 
DFA worst case | O((|r|?2!"!) O(lz|) 
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方法 中 较 好 的 一 个 差不多 。 这 个 策略 从 模拟 NFA 开始 , 但 是 在 计算 出 各 个 状态 集 ( 也 就 是 DPA 
的 状态 ) 和 转换 的 同时 把 它们 记录 下 来 。 在 模拟 中 每 次 处 理 此 NFA 的 当前 状态 集合 和 当前 输入 
符号 之 前 , 首先 查看 我 们 是 否 已 经 计算 了 这 个 转换 。 如 果 是 ; 就 直接 使 用 这 个 信息 。 
3.7.6 3.7 节 的 练习 

练习 3.7.1: 将 下 列 图 中 的 NFA 转换 为 DFA。 

1) 图 3-26 

2) 图 3-29 

3) 图 3-30 

练习 3. 7. 2: 用 算法 3. 22 模拟 下 列 图 中 的 NFA 在 处 理 输入 aabb 时 的 过 程 。 

1) 图 3-29 

2) 图 3-30 

练习 3. 7. 3: 使 用 算法 3. 23 和 3.20 将 下 列 正则 表达 式 转换 成 DFA。 

1) (alb) * 

2) (ar 16") * 

3) ( (ela)b*)* 

4) (alb) * abb(alb) * 


3.8 词法 分 析 器 生成 工具 的 设计 


本 节 中 我 们 将 应 用 3.7 节 中 介绍 的 技术 , 讨论 像 Lex 这 样 的 词法 分 析 器 生成 工具 的 体系 结 
构 。 我 们 将 讨论 两 种 分 别 基 于 NFA 和 DFA 的 方法 ,后 者 实质 上 就 是 Lex 的 实现 方法 。 

3.8.1 生成 的 词法 分 析 器 的 结构 

图 3-49 概括 了 由 Lex 生成 的 词法 分 析 器 的 体系 结构 。 作 为 词法 分 析 器 的 程序 包含 一 个 固定 
的 模拟 自动 机 的 程序 。 现 在 我 们 暂时 不 规定 这 个 自动 机 是 确定 的 还 是 不 确定 的 。 词 法 分 析 器 的 
其 他 部 分 是 由 Lex 根据 Lex 程序 创建 的 组 件 组 成 的 。 

这 些 组 件 包括 : 

1) 表示 自动 机 的 一 个 转换 表 。 

2) 由 Lex 编译 器 从 Lex 程序 中 直接 拷 jk 
贝 到 输出 文件 的 函数 ( 见 3. 5. 2 节 的 讨论 ) 。 

3) 输入 程序 定义 的 动作 。 这 些 动 作 是 
一 些 代码 片段 , 将 在 适当 的 时 候 由 自动 机 模 
拟 器 调用 。 

在 构建 自动 机 时 , 我 们 首先 用 算法 
3.23 把 Lex 程序 中 的 每 个 正则 表达 式 模式 
转换 为 一 个 NFA, 我 们 需要 使 用 一 个 自动 Lex 
机 来 识别 所 有 与 Lex 程序 中 的 模式 相 匹配 的 。 程 
词素 , 因此 我 们 将 这 些 NPA 合并 为 一 个 
NFA。 合 并 的 方法 是 引入 一 个 新 的 开始 状 图 3-49 一 个 Lex 程序 被 转变 成 由 有 限 自动 
AS, 从 这 个 新 开始 状态 到 各 个 对 应 于 模式 p; 机 模拟 器 使 用 的 转换 表 和 动作 
的 NFA Ni 的 开始 状态 各 有 一 个 < 转换 。 构 造 方法 如 图 3-50 所 示 。 

CEJ 我 们 将 使 用 如 下 所 述 的 简单 、 抽 象 的 例子 来 说 明 本 节 所 要 说 明 的 思想 : 





地 
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a 1 模式 pi 的 动作 A | 
abb 1 模式 ps 的 动作 Ad} 
a*b+ “| 模式 ps 的 动作 43| 
请 注意 , 上 述 三 个 模式 之 间 存在 我 们 在 3.5.3 节 中 讨论 过 的 冲突 。 更 明确 地 说 ， FITE abb 
同时 满足 第 二 个 和 第 三 个 模式 , 但 是 我 们 将 把 它 看 作 模式 pz 的 词素 ,因为 在 上 面 的 Lex 程序 中 
首先 列 出 的 是 模式 忆 。 像 aab850… 这 样 的 输入 串 有 很 多 前 绥 都 满足 第 三 个 模式 ，Lex 的 规则 是 接 
受 最 长 的 前 级 ,因此 我 们 不 断 读 人 85, 直到 另 一 个 a 出 现 为 止 。 此 时 我 们 报告 识别 的 词素 就 是 从 
第 一 个 < 开始 的 、 包 含 了 其 后 所 有 4” 的 符号 串 。 








图 3-50 “根据 Lex 程序 构造 得 到 的 一 个 NFA 


图 3-51 列 出 了 分 别 识别 这 三 个 模式 的 NFA。 其 中 第 三 个 NFA 是 根据 算法 ,3.23 的 转换 结果 
经 简化 得 到 的 。 然 后 , 图 3-52 显示 了 通过 加 入 一 个 新 开始 状态 0 和 3 个 < 转换 将 这 三 个 NFA 合 
并 后 得 到 的 单个 NFA。 口 


= 0—0 





start b 
a 
b 
图 3-51 a, abb fil a*b*ġj NFA 图 3-52 “合并 后 的 NFA 


3.8.2 基于 NFA 的 模式 匹配 

如 果 词 法 分 析 器 模拟 了 像 一 个 图 3-52 所 示 的 NFA, 那么 它 必须 从 它 的 输入 中 lexemeBegin 所 
指 的 位 置 开始 读 取 输入 。 当 它 在 输入 中 向 前 移动 forward 指针 时 , 它 在 每 个 位 置 上 根据 算法 3. 22 
计算 当前 的 状态 集 。 

在 这 个 模拟 NFA 运行 的 过 程 中 , 最 终 会 到 达 一 个 没有 后 续 状 态 的 输入 点 。 那 时 , 不 可 能 有 
任何 更 长 的 输入 前 缀 使 得 这 个 NFA 到 达 某 个 接受 状态 , 此 后 的 状态 集 将 一 直 为 空 。 于 是 , RM 
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就 可 以 判定 最 长 前 缀 (与 某 个 模式 匹配 的 词素 ) 是 什么 。 

我 们 沿 着 状态 集 的 顺序 回头 寻找 , 直到 找到 一 个 包含 一 个 或 多 个 接受 状态 的 集合 为 止 。 如 
果 集合 中 有 多 个 接受 状态 , 我 们 就 选择 和 在 Lex 程序 中 位 置 最 靠 前 的 模式 相关 联 的 那个 接受 状态 
pio BATE forward 指针 移 回 到 词素 末尾 ,同时 执行 与 p: 相 关联 的 动作 Ao 
DEET LERMAN 3. 26 所 示 的 模式 , 并 且 输 入 字符 串 以 aba 开头 。 如 果 图 3. 52 中 的 
NFA 从 初始 状态 0 的 e- 闭 包 , BDO, 1,3, 7}, 开始 处 理 输入 , 那么 它 进入 的 状态 集合 的 序列 如 图 
3-53 所 示 。 在 读 和 人 第 四 个 输入 符号 之 后 , 我 们 处 于 一 个 空 状态 集中 , 因为 在 图 3-52 中 没有 在 输 
入 a 上 离开 状态 8 的 转换 。 


*#ht 
atb z 


4 b 
a ay i none 
g 

En 


Z 3-53 ERI A aaba 时 进入 的 状态 集 的 序列 

因此 , 我 们 要 向 回 寻找 一 个 包含 了 某 个 接受 状态 的 状态 集 。 请 注意 , 如 图 3-53 所 示 ， 在 读 人 
a 之后, 我 们 所 在 的 状态 集 包含 状态 2, 这 表明 模式 a 已 经 被 匹配 。 然 而 在 读 人 aab 之 后 , 我们 在 
状态 8 中 ,这 表明 模式 a" b+ 被 匹配 ; 前 级 uab 是 最 长 的 使 我 们 到 达 某 个 接受 状态 的 前 绥 。 因 此 
我 们 选择 aab 作为 被 识别 的 词素 ,并且 执行 43 。 这 个 动作 应 该 包含 一 个 返回 语句 ， 向 语法 分 析 器 
指明 已 经 找到 了 一 个 模式 为 ps =a" b* 的 词法 单元 。 m 
3.8.3 ”词法 分 析 器 使 用 的 DFA 

另 一 种 体系 结构 和 Lex 的 输出 相似 , 它 使 用 算法 3. 20 中 的 子 集 构 造 法 将 表示 所 有 模式 的 
NFA 转换 为 等 价 的 DFA。 在 DFA 的 每 个 状态 中 ,如果 该 状态 包含 一 个 或 多 个 NFA 的 接受 状态 ， 
那么 就 要 确定 哪些 模式 的 接受 状态 出 现在 此 DFA 状态 中 , 并 找 出 第 一 个 这 样 的 模式 。 然 后 将 该 
模式 作为 这 个 DFA 状态 的 输出 。 
DREJ 使 用 子 集 构造 法 可 以 根据 图 3-52 中 的 NFA 构造 得 到 一 个 DRA。 图 3-54 显示 了 这 个 
DFA 的 一 个 转换 图 。 图 中 的 接受 状态 都 用 该 状态 所 标识 的 模式 作为 标号 。 例 如 ,状态 16, 81 有 
两 个 接受 状态 ,分 别 对 应 于 模式 abb 和 a*b*。 由 于 前 一 个 模式 先 被 列 出 , 因此 该 模式 就 是 状态 
16, 8| 所 关联 的 模式 。 o 


N 





a*bt abb a*b* 


图 3-54 处理 模式 a abb Fil a*b* AY DFA 的 转换 图 
在 词法 分 析 器 中 , 我 们 使 用 DFA 的 方法 与 使 用 NFA 的 方法 很 相似 。 我 们 模拟 这 个 DFA 的 运 
行 , 直到 在 某 一 点 上 没有 后 续 状 态 为 止 ( 严 格 地 说 应 该 是 下 一 个 状态 为 8, 即 对 应 于 空 的 NFA 状 
态 集合 的 死 状 态 ) IEI, 我 们 回头 查找 我 们 进入 过 的 状态 序列 , 一 旦 找到 接受 状态 就 执行 与 该 
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状态 对 应 的 模式 相关 联 的 动作 。 
ARESA 假设 图 3-54 中 的 DFA 的 输入 为 abba, 处 理 输入 时 进入 过 的 状态 序列 为 0137、 247、 
58、68。 在 读 入 最 后 一 个 a 时 ,没有 离开 状态 68 的 相应 转换 。 因 此 我们 从 后 向 前 沽 察 这 个 状态 
序列 。 在 这 个 例子 中 ,68 本 身 就 是 一 个 接受 状态 ,对 应 于 模式 p = abb。 o 
3.8.4 ”实现 向 前 看 运算 符 

PUPS. 5. 4 节 可 知 ，Lex 模式 /rs 中 的 Lex 向 前 看 运算 符 / 是 必 不 可 少 的 。 因 为 有 时 为 了 正 
酌 地 识别 某 个 词法 单元 的 实际 词素 ， 我 们 需要 指明 在 这 个 词法 单元 的 模式 之 后 必须 跟着 模式 
”在 将 模式 六 ra 转化 成 NFA 时 ,我 们 把 /看 成 。, 因此 我 们 实际 上 不 会 在 输入 中 查找 户 然而 ， 
如 果 NEA 发 现 输入 缓冲 区 的 一 个 前 组 ay 和 这 个 正则 表达 式 匹 配 时 ， 这 个 词素 的 未 尾 并 不 在 这 个 
、^ 过 和 接受 状态 的 地 方 。 实 际 上 , 这 个 未 尾 是 在 此 NFA 进入 满足 如 下 条 件 的 状态 ; 的 地 方 ， 

1) s 在 (假想 的 )/ 上 有 一 个 < 转换 。 

2) 有 一 条 从 NFA 的 开始 状态 到 状态 s( 相应 标号 序列 为 4) 的 路 径 。 

3) 有 一 条 从 状态 * 到 NFA 的 接受 状态 ( 相应 标号 序列 为 y) 的 路 径 。 

4) 在 所 有 满足 条 件 1 ~3 的 xy Hh, x 尽 可 能 长 。 

如 果 这 个 NFA 中 只 有 一 个 在 假想 的 /上 的 上 转换 状态 ， 那么 就 如 例 3. 30 所 示 , 词素 的 未 尾 出 
六 最 后 “次 进入 该 状态 的 地 方 。 如 果 NFA 在 假想 的 /上 有 多 个 < 转换 状态 ,那么 如 何 寻 找 正确 
的 状态 * 的 问题 就 会 变 得 困难 得 多 。 

6) 3. 30 图 3.55 的 NFA 识别 例 3. 13 中 给 出 的 IF BER. RERIT MAHA. aR: 
T, 从 状态 2 到 状态 3 的 < 转换 就 代表 这 个 向 前 看 运算 符 。 状 态 6 表明 关键 字 IF 的 出 现 。 然 而 
当 进 人 状态 6 时 ,我 们 需要 向 回 扫描 到 最 晚 出 现 的 状态 2 才 可 以 找到 词素 IF. o 


eci 





DFA 中 的 死 状态 

从 技术 上 讲 , 图 3-54 中 的 自动 机 并 不 是 一 个 真正 的 DFA, KX DFA 中 的 每 个 状态 在 它 
的 输入 字母 表 中 的 每 个 符号 上 都 有 一 个 离开 转换 。 这 里 我 们 省 略 了 到 达 死 状态 Ø 的 转换 ,并 
且 我 们 也 省 略 了 从 这 个 死 状态 出 发 在 所 有 输入 符号 上 到 达 其 自身 的 转换 。 前 面 的 NFA 到 
DFA 转换 的 例子 中 不 存在 从 开始 状态 到 达 g 的 路 径 , 但 是 图 3-52 中 的 NFA 有 这 样 的 路 径 。 

然而 ， 当 我 们 构造 一 个 用 于 词法 分 析 器 的 DFA 时 , 重要 的 是 , 我 们 必须 用 不 同 的 方式 来 
处 理 死 状态 ， 因为 我 们 必须 知道 什么 时 候 已 经 不 可 能 识别 到 更 长 的 词素 了 。 因此 我 们 建议 省 
略 到 达 死 状态 的 转换 ,并 消除 死 状 态 本 身 。 实际 上 这 个 问题 要 比 看 起 来 困难 一 些 ， 因为 一 个 
NFA 到 DFA 的 构造 过 程 可 能 会 产生 多 个 不 可 能 到 达 接 受 状 态 的 DFA 状态 。 我 们 必须 知道 何 
时 到 达 了 一 个 这 样 的 状态 。3. 9.6 节 讨 论 了 如 何 将 这 些 状态 合并 为 一 个 死 状 态 ， 这 使 得 识别 
这 些 状态 变 得 容易 。 还 要 指出 的 是 ， 如 果 我 们 使 用 算法 3. 20 和 3. 23 根据 一 个 正则 表达 式 构 
| 造 出 一 个 DFA, 那么 得 到 在 DFA 中 除 Ø 之 外 的 所 有 状态 都 可 到 达 某 个 接受 状态 。 
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图 3-55“ 识别 关键 字 IF 的 NFA 


词法 分 析 = 











3.8.5 3.8 FHAY 

练习 3. 8. 1: 假设 我 们 有 两 个 词法 单元 : (1) 关 键 字 if, (2) 标 识 符 , 它 表示 除 if 之 外 的 所 
有 由 字母 组 成 的 串 。 请 给 出 : 

1) 识别 这 些 词法 单元 的 NFA。 

2) 识别 这 些 词 法 单元 的 DFA。 

练习 3.8.2: 对 如 下 的 词法 单元 重复 练习 3. 8.1: (1) 关 键 字 while, (2) 关 键 字 when, 
(3) 标 识 符 ， 它 代表 以 字母 开头 、 由 字母 和 数位 组 成 的 字符 串 ; 

! 练习 3. 8. 3: 假设 我 们 修正 DFA 的 定义 , 使 得 每 个 状态 在 每 个 输入 符号 上 有 零 不 或 一 个 转 
换 (而 不 是 像 标准 的 DFA 定义 中 那样 恰好 有 一 个 转换 )。 那 么 , 有 些 正则 表达 式 就 可 以 具有 相 比 
按 标准 定义 构造 得 到 的 DFA 而 言 更 小 的 “DFA”。 给 出 这 种 正则 表达 式 的 一 个 例子 。 

11 练习 3. 8. 4: 设计 一 个 算法 来 识别 形 如 ri/r, 的 Lex 向 前 看 模式 , 其 中 m 和 7, 都 是 正则 
表达 式 。 说 明 该 算法 如 何 处 理 如 下 输入 : 

1) (abed\abe)/d 

2) (alab)/ba 

3) aaa” 


3.9 基于 DFA 的 模式 匹配 器 的 优化 


我 们 将 在 本 节 中 给 出 三 个 算法 ， 这 些 算法 用 于 实现 和 优化 根据 正则 表达 式 构造 得 到 的 模式 
匹配 器 。 

1) 第 一 个 算法 可 以 用 于 Lex 编译 器 ,因为 它 不 需 构造 中 间 的 NFA 就 可 以 根据 一 个 正则 表达 
式 直接 构造 得 到 DFA。 同 时 , 得 到 的 DFA 的 状态 数 也 比 通过 NFA 构造 得 到 的 DFA 的 状态 数 少 。 

2) 第 二 个 算法 可 以 将 任何 DFA 中 具有 相同 未 来 行为 的 多 个 状态 合并 , 从 而 使 该 DFA 的 状态 
数量 减 到 最 少 。 这 个 算法 本 身 相当 高 效 , 它 的 时 间 复 杂 度 仅 有 O(nlogn) ,其 中 是 被 处 理 的 
DFA 的 状态 数量 。 

3) 第 三 个 算法 可 以 生成 比 标准 二 维 表 更 加 紧凑 的 转换 表 的 表示 方式 。 
3.9.1 NFA 的 重要 状态 

在 讨论 如 何 根据 一 个 正则 表达 式 直 接生 成 DFA 之 前 , 我 们 必须 首先 深入 分 析 算 法 3.23 构建 
NFA 的 过 程 ,并 考虑 各 种 状态 所 扮演 的 角色 。 如 果 一 个 NFA 状态 有 一 个 标号 非 e 的 离开 转换 ， 
那么 我 们 称 这 个 状态 是 重要 状态 (important state) 。 请 注意 , 子 集 构造 法 (算法 3. 20) 在 计算 
e-closure( move( T, a) )( 即 可 以 从 了 出 发 在 输入 ea 上 到 达 的 状态 的 集合 ) 的 时 候 , 它 只 使 用 了 集合 
7 中 的 重要 状态 。 也 就 是 说 , 只 有 当 状 态 s 是 重要 的 , 状态 集合 move(s, a) 才 可 能 是 非 空 的 。 在 
子 集 构造 法 的 应 用 过 程 中 , 两 个 NFA 状态 集合 可 以 被 认为 是 一 致 的 即 把 它们 当 作 同 一 个 集合 来 
处 理 ) 条 件 是 它们 : 

1) 具有 相同 的 的 重要 状态 , A 

2) 要 么 都 包含 接受 状态 , 要 么 都 不 包含 接受 状态 。 

如 果 这 个 NFA 是 使 用 算法 3. 23 根据 一 个 正则 表达 式 生 成 的 ， 那么 我 们 还 可 以 指出 更 多 的 关 
于 重要 状态 的 性 质 。 重要 状态 只 包括 在 基础 规则 部 分 为 正则 表达 式 中 某 个 特定 符号 位 置 引 入 的 
初始 状态 。 也 就 是 说 ， 每 个 重要 状态 对 应 于 正则 表达 式 中 的 某 个 运算 分 量 。 

此 外 , 构造 得 到 的 NFA 只 有 一 个 接受 状态 ， 但 该 接受 状态 (没有 离开 转换 ) 不 是 重要 状态 。 
我 们 可 以 在 一 个 正则 表达 式 7 的 右 端 连接 一 个 独特 的 右 端 结束 标记 符 #, 使 得 + 的 接受 状态 增加 
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一 个 在 # 上 的 转换 , 使 之 成 为 (7)# 的 NFA 的 重要 状态 。 换 句 话说 ， 通过 使 用 扩展 的 (augment) 正 
则 表达 式 (7)#, 我 们 可 以 在 构造 过 程 中 不 考虑 接受 状态 的 问题 。 当 构造 过 程 结束 后 ， 任何 在 # 上 
有 离开 转换 的 状态 必然 是 一 个 接受 状态 。 

NFA 的 重要 状态 直接 对 应 于 正则 表达 式 中 存放 了 字母 表 中 符号 的 位 置 。 使 用 抽象 语法 树 来 
表示 扩展 的 正则 表达 式 是 非常 有 用 的 。 该 语法 分 析 树 的 叶子 结 点 对 应 于 运算 分 量 , 内 部 结 点 表 
示 运 算 符 。 标 号 为 连接 运算 符 (。)、 并 运算 符 1、 星 号 运算 符 * 的 内 部 结 点 分 别称 为 cat 结 点 、or 
结 点 和 star 结 点 。 我 们 可 以 使 用 2. 5. 1 节 中 处 理 算术 表达 式 的 方法 来 构造 一 个 正则 表达 式 对 应 的 
抽象 语法 树 。 


BE 生 对。 图 3-56 是 一 个 正则 表达 式 的 抽象 语法 树 。 其 中 的 小 圆圈 表示 cat 结 点 。 口 
gh a? 
hs 
A 
A co ; 
| 3 
1 
a 
1 2 


图 3-56 (alb)*abb# 的 抽象 语法 树 


抽象 语法 树 的 叶子 结 点 可 以 标号 为 e, 也 可 以 用 字母 表 中 的 符号 作为 标号 。 对 于 每 一 个 标号 
不 为 e 的 叶子 结 点 , 我 们 赋予 一 个 独 有 的 整数 。 我 们 将 这 个 整数 称 为 叶子 结 点 的 位 置 (position) , 
同时 也 表示 和 它 对 应 的 符号 的 位 置 。 请 注意 ,一 个 符号 可 以 有 多 个 位 置 。 比 如 , 在 图 3-56 中 , a 
有 位 置 1 和 位 置 3。 抽 象 语法 树 中 的 这 些 位 置 对 应 于 构造 出 的 NFA 中 的 重要 状态 。 
DEEA 3-57 显示 了 对 应 于 图 3-56 中 的 正则 表达 式 的 NFA, 其 中 的 重要 状态 已 经 被 编号 , 而 其 他 
状态 则 用 字母 表示 。 我 们 很 快 就 会 看 到 , NFA 的 编号 状态 和 抽象 语法 树 中 的 位 置 是 如 何 对 应 的 。 ” 口 





图 3-57 使 用 算法 3. 23 构造 得 到 的 (alb) ”abb# 的 NFA 


3. 9.2， 根 据 抽 象 语法 树 计 算得 到 的 函数 
要 从 一 个 正则 表达 式 直 接 构 造 出 DFA, 我 们 要 首先 构造 它 的 抽象 语法 树 ， 然 后 计算 如 下 四 个 
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函数 : nullable, firstpos , lastpos Fil followpos., 每 个 函数 的 定义 都 用 到 了 一 个 特定 增 广 正则 表达 式 
(r)# 的 抽象 语法 树 。 

1) nullable( n) 对 于 一 个 抽象 语法 树 结 点 为 真 当 且 仅 当 此 结 点 代表 的 子 表 达 式 的 语言 中 包 
含 空 串 e。 也 就 是 说 ,这 个 子 表达 式 可 以 “生成 空 串 ”或 者 本 身 就 是 空 串 ,即使 它 也 可 能 表示 一 些 
其 他 的 串 。 

2) firstpos(n) 定 义 了 以 结 点 为 根 的 子 树 中 的 位 置 集合 。 这 些 位 置 对 应 于 以 nn 为 根 的 子 表达 
式 的 语言 中 某 个 串 的 第 一 个 符号 。 

3) lastpos(n) 定 义 了 以 结 点 nn 为 根 的 子 树 中 的 位 置 集 合 。 这 些 位 置 对 应 于 以 n 为 根 的 子 表达 
式 的 语言 中 某 个 串 的 最 后 一 个 符号 。 

4) followpos(p) 定 义 了 一 个 和 位 置 p 相关 的 、 抽 和 象 语法 树 中 的 某 些 位 置 的 集合 。 一 个 位 置 g 在 
followpos(p) 中 当 且 仪 当 存 在 L((7)#) 中 的 某 个 串 x=ala,…a,, 使 得 我 们 在 解释 为 什么 x 属于 
L((r)#) IY, 可 以 将 x 中 的 某 个 a; 和 抽象 语法 树 中 的 位 置 p 匹配 , 且 将 位 置 a; ,1 和 位 置 g 匹配 。 
考虑 图 3-56 中 对 应 于 表达 式 (alb) *a 的 cat 结 点 no 我 们 说 nullable(n) = false, 因 
为 这 个 结 点 生成 所 有 以 a 结尾 的 由 a、b 组 成 的 串 ; 它 不 生成 空 串 e。 而 另 一 方面 , 它 下 面 的 
star 结 点 是 可 以 为 空 , 它 的 正则 表达 式 生 成 e 以 及 所 有 由 心 .2 组 成 的 串 。 

firsipos(n) =11,2,3|。 在 由 nn 对 应 的 正则 表达 式 生成 的 像 ca 这 样 的 串 中 , 该 串 的 第 一 个 位 
置 对 应 于 树 中 的 位 置 1; 在 像 ba 这 样 的 串 中 , 串 的 第 一 个 位 置 来 自 于 树 中 的 位 置 2。 然 而 , 当 由 
n 代表 的 正则 表达 式 生 成 的 串 仅 包含 a 时, 这 个 a 来 自 于 位 置 3。 

lastpos(n) = {3} 也 就 是 说 , 不 管 结 点 的 表达 式 生成 什么 串 , 该 串 的 最 后 一 个 位 置 总 是 来 
自 位 置 3 士 的 &。 

followpos 的 计算 要 困难 一 些 ; 但 是 我 们 很 快 会 给 出 计算 这 个 函数 的 规则 。 下面 是 推导 得 到 
followpos 值 的 一 个 例子 :followpos(1) = {1, 2,3}. 考虑 一 个 串 …ac…, 其 中 ce 代 表 a 或 5, Ha HK 
自 位 置 1。 也 就 是 说 , 这 个 a 是 由 表达 式 (alb)* 中 的 a 生成 的 多 个 a 之 一 。 这 个 g 后 面 可 以 跟 
随 由 同一 表达 式 (alb) “生成 的 a 或 6, 此 时 来 自 位 置 1 或 位 置 2。 也 有 可 能 这 个 a 是 表达 式 
(alb) * 生成 的 串 的 最 后 一 个 字符 , 那么 c 一定 是 来 自 位 置 3 的 a。 因 此 , 1、2、3 就 是 可 以 跟 在 
位 置 1 后 的 位 置 。 O 
3.9.3 i+ nullable, firstpos 及 lastpos 

我 们 可 以 使 用 一 个 对 树 的 高 度 直 接 进 行 递归 的 过 程 来 计算 nullable, firstpos 和 lastpos。 在 
3-58 中 总 结 了 计算 nullable 和 .firstpos 的 基本 规则 和 归纳 规则 。 计 算 lastpos 的 规则 在 本 质 上 和 计 
T firstpos 的 规则 相同 , 但 是 在 针对 cat 结 点 的 规则 中 , 子 结 点 cy Alc, 的 角色 需要 对 调 。 

























Bn mala) 
re 
NEA Tt PH 


一 个 or- A n= cje | nullable(c,) or | firstpos(c,) U firstpos(c2) 
nullable(c2) 
一 个 cat- 结 点 nm = cic | nullable(c,) and if ( nullable(c:) ) 
nullable(c2) firstpos(c,) U firstpos(c2) 
else firstpos(c;) 
[Far TY | wae [ebony 


图 3-58“ 计算 nullable 和 firstpos 的 规则 












112 第 3 章 





DEE 在 图 3-56 的 语法 树 的 所 有 结 点 中 , 只 有 星 号 结 点 是 可 为 空 的 。 由 图 3-58 可 知 ， 图 中 
的 所 有 叶子 结 点 都 是 不 可 为 空 的 , 因为 它们 都 对 应 于 非 。 运算 分 量 。 图 3-56 中 的 or 结 点 是 不 可 
为 空 的 , 因为 它 的 子 结 点 都 不 可 为 空 。 图 中 的 star- 结 点 是 可 空 的 , 因为 这 是 star 结 点 的 特征 之 
一 。 最 后 , 图 3.56 中 的 所 有 cat 结 点 ( 至 少 包含 一 个 不 可 为 空 的 子 结 点 ) 都 是 不 可 为 空 的 。 


对 各 个 结 点 的 firstpos 和 lastpos 的 计算 结 {1,2,3} o {6} 
果 显 示 在 图 3-59 中 , 其 中 , firstpos(n) 显 示 在 we 
结 点 n 的 左边 , lastpos(n) 显示 在 结 点 右边 。 {1,2,3} o {5) {6} # (6} 
每 个 叶子 结 点 的 万 stpos 和 lasipos 只 包含 它 自 过 
身 , 这 是 由 图 3.58 中 关于 非 e 叶子 结 点 的 规 iii oe 
则 决定 的 。 图 3-56 中 的 or 结 点 的 firstpos 和 {1,2,3} o {3} {4} b {4} 
lastpos 分 别 是 它 的 所 有 子 结 点 的 firstpos 和 Oo Uae ee 
lastpos 的 并 集 。 针 对 star 结 点 的 规则 是 , 它 (1,2) * {1.2} Pier 


的 .firstpos 及 lastpos 分 别 是 它 的 唯一 子 结 点 的 | 
firstpos 和 lastpos o Gey 4 

最 后 考虑 最 下 面 的 cat: 结 点 ,我 们 将 把 ayam 2) 121 
这 个 结 点 称 为 no BIA firstpos(n), RIIE 
先 考虑 其 左边 的 运算 分 量 是 否 可 为 空 。 在 这 
个 例子 里 面 , 左 运算 分 量 可 以 为 空 , 因此 , n 
的 firstpos 是 它 的 各 个 子 结 点 的 firstpos 的 并 集 , 也 就 是 (1; 2}U13} = 11, 2,3). A358 中 没有 
明确 说 明 lastpos 的 运算 规则 , 但 是 前 面 提 到 过 , 它 的 规则 和 .firstpos 的 规则 相同 , 只 是 需要 互 换 子 
结 点 的 角色 。 也 就 是 说 , 要 计算 lasipos(n), 我们 需要 知道 它 的 右 子 结 点 (位 置 为 3 的 叶子 结 点 ) 
是 否 可 为 空 。 它 不 可 为 空 ， 因 此 lastpos(n) 就 是 它 的 右 子 结 点 的 Jastpos,， 即 13} 。 Oo 
3.9.4 计算 followpos 

最 后 , 我 们 来 了 解 一 下 如 何 计算 函数 .followpos。 只 有 两 种 情况 会 使 得 一 个 正则 表达 式 的 某 个 
位 置 会 跟 在 另 一 个 位 置 之 后 : 

1) 如 果 是 一 个 ca 结 点 ,， 且 其 左右 子 结 点 分 别 为 cl co, 那么 对 于 lastpos(c,) 中 的 每 个 位 
E i, firstpos(c.) 中 的 所 有 位 置 都 在 followpos(i) 中 。 

2) WER n Æ star 结 点 , 并且 i 是 lastpos(n) 中 的 一 个 位 置 , 那么 firstpos(n) 中 的 所 有 位 置 都 在 
followpos(i) 中。 
也 潍 引 ” 现 在 让 我 们 继续 考虑 那个 贯穿 全 节 的 例子 。 回 顾 一 下 ,firstpos 和 lastpos 已 经 在 图 
3-59 中 计算 出 来 了 。followpos 的 计算 规则 1 要 求 我 们 查看 每 个 ca Ba, 并 将 它 的 右 子 结 点 的 
firstpos 中 的 每 个 位 置 放 到 它 的 左 子 结 点 的 lastpos 中 的 各 个 位 置 的 .followpos 中 。 对 于 图 3-59 中 最 
下 面 的 cat 结 点 , 该 规则 说 位 置 3 在 followpos(3) 和 followpos(2) 中 。 其 上 一 个 cat 结 点 说 4 在 fol- 
lowpos(3) 中 , 余下 的 两 个 cat 结 点 告诉 我 们 5 在 .followpos(4) 中 ,6 在 followpos(5) 中 。 

我 们 还 必须 对 star 结 点 应 用 规则 2。 该 规则 告诉 我 们 位 置 1 和 2 既 在 .followpos(1) 中 又 在 followpos 
(2) 中 , 因为 这 个 结 点 的 firstpos 和 lastpos 都 是 |1, 2} 。 图 3-60 给 出 了 全 部 的 .followpos 集合 。 Oo 

我 们 可 以 创建 一 个 有 向 图 来 表示 函数 .followpos, 其 中 每 个 位 置 有 一 个 对 应 的 结 点 , 从 位 置 i 到 位 置 7 
有 一 条 有 向 边 当 目 仅 当 j 在 followpos(i) 中 。 图 3-61 显示 的 有 向 图 表示 了 图 3- 60 所 示 的 .followpos 函数 。 

毫 不 奇怪 , 表示 followpos 函数 的 有 向 图 几乎 就 是 相应 的 正则 表达 式 的 不 包含 转换 的 NFA, 

如 果 我 们 进行 下 面 的 处 理 , 这 个 图 就 变 成 了 这 样 的 一 个 NFA。 


图 3-59 (alb) * abb# 的 语法 分 析 树 的 结 点 
的 firstpos 和 lastpos 
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1) 将 根 结 点 的 firstpos 中 的 所 有 位 置 设 为 开始 状态 。 
2) 在 每 条 从 i 到 j 的 有 向 边 上 添加 位 置 ; 上 的 符号 作为 标号 。 
3) 把 和 结尾 # 相 关 的 位 置 当 作 唯 一 的 接受 状态 。 


> 











ie ee) 


cos 


3-60 K% followpos 3-61 表示 函数 followpos 的 有 向 图 

3.9.5 根据 正则 表达 式 构建 DFA 
从 一 个 正则 表达 式 > 构造 DFA。 

输入 : 一 个 正则 表达 式 ro 

输出 : 一 个 识别 L(r) 的 DFA D, 

方法 : 

1) 根据 扩展 的 正则 表达 式 (r)# 构 造 出 一 棵 抽象 语法 树 7。 

2) 使 用 3.9.3 节 和 3.9.4 节 的 方法 , 计算 得 到 7 的 函数 nullable, firstpos 、1asipos Fil followpos , 

3) 使 用 图 3-62 中 所 示 的 过 程 , 构造 出 DD 的 状态 集 Dstates A D 的 转换 函数 Dtran, D 的 状态 
就 是 了 中 的 位 置 集 合 。 每 个 状态 最 初 都 是 “未 标记 的 ”， 当 我 们 开始 考虑 某 个 状态 的 离开 转换 时 ， 
该 状态 变 成 “已 标记 的 "。D 的 开始 状态 是 firstpos(no)，, 其 中 结 点 no 是 了 的 根 结 点 。 这 个 DFA 的 
接受 状态 集合 是 那些 包含 了 和 结束 标记 # 对 应 的 位 置 的 状态 。 O 
初始 化 Dstates ,使 之 只 包含 未 标记 的 状态 firstpos(no), 


其 中 no 是 (7) 天 的 抽象 语法 树 的 根 结 点 ; 
while ( Dstates 中 存在 未 标记 的 状态 3 ) { 











标记 9; 
for (每 个 输入 符号 a ) { 
令 吕 为 8 中 和 4 对 应 的 所 有 位 置 p 的 followpos(p) 的 并 集 ; 
证 (可 不 在 Dstates 中 ) 

将 UU 作为 未 标记 的 状态 加 入 到 Dstates 中 ; 
DitranlS,a] = U; 








图 3-62 从 一 个 正则 表达 式 直 接 构造 一 个 DFA 


现在 我 们 可 以 把 我 们 的 连续 使 用 的 例子 的 各 个 步骤 综合 起 来 ,为 正则 表达 式 r= (al 
b) * abb 构造 一 个 DFA。(7)# 的 语法 分 析 树 如 图 3-56 所 示 。 我 们 观察 到 , 在 这 棵 语法 分 析 树 中 ， 
只 有 star 结 点 使 nullable 为 真 。 我 们 将 函数 firstpos 和 lastpos 显示 在 图 3-59 tH, BKZ followpos 的 值 
显示 在 图 3-60 中 。 

这 棵 树 的 根 结 点 的 firstpos 的 值 是 |1, 2, 3} , RIIE D 的 开始 状态 就 是 这 个 集合 。 我 们 称 这 个 集合 为 
4。 我 们 必须 计算 Diran[4, a] 和 Drran[4, b]o ZEA 的 位 置 中 , 1 和 3 对 应 于 a, 而 2 对 应 于 b。 因此 应 - 
ran[ A, a] = followpos(1) Ufollowpos(3) = {1, 2, 3,4}; Dtran[A, b] = followpos(2) = {1,2,3}. 后 
一 个 集合 就 是 4, 因此 不 需要 加 入 到 Dstates 中 。 但 是 前 二 个 状态 集 B= 11, 2,3, 4| 是 新 状态 , 因此 我 
们 将 它 加 入 到 Dirans 中 并 计算 它 的 转换 。 完 整 的 DFA 如 图 3-63 所 示 。 Oo 


H 
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图 3-63 根据 图 3-57 构造 得 到 的 DFA 


3.9.6 最 小 化 一 个 DFA 的 状态 数 

对 于 同一 个 语言 , 可 以 存在 多 个 识别 此 语言 的 DFA。 例 如 , 图 3-36 和 图 3-63 中 的 DFA 都 识 
别 语言 L((alb) *abb)。 这 两 个 DFA 不 但 各 个 状态 的 名 字 不 同 ,就 连 它们 的 状态 个 数 也 不 一 样 。 
如 果 我 们 使 用 DFA 来 实现 词法 分 析 器 , 我 们 总 是 希望 使 用 的 DFA 的 状态 数量 尽 可 能 地 少 ; 因为 
描述 词法 分 析 器 的 转换 表 需 要 为 每 个 状态 分 配 条 目 。 

状态 名 字 的 问题 是 次 要 的 。 如 果 我 们 只 需 改变 状态 名 字 就 可 以 将 一 个 自动 机 转换 成 为 另 一 
个 自动 机 , 我 们 就 说 这 两 个 自动 机 是 同 构 的 。 图 3-36 和 图 3-63 中 的 两 个 自动 机 不 是 同 构 的 。 然 
而 , 这 两 个 自动 机 的 状态 之 间 有 很 紧密 的 关系 。 图 3-36 中 的 状态 4 和 C 实际 上 是 等 价 的 , 因为 
它们 都 不 是 接受 状态 , 且 对 任意 输入 , 它们 总 是 转 到 同一 个 状态 一 一 在 输入 LERB, EMA b 
上 转 到 C。 不 仅 如 此 , 状态 4 和 C 的 行为 都 和 图 3-63 中 的 状态 123 相似 。 类 似 地 , 图 3. 36 中 状 
态 的 行为 和 图 3-63 中 状态 1234 的 行为 相似 ,状态 的 行为 和 状态 1235 的 行为 相似 ,状态 的 

行为 和 状态 1236 的 行为 相似 。 

可 以 得 出 一 个 重要 的 结论 ; 任何 正则 语言 都 有 一 个 哈 一 的 (不 计 同 交 ) 状 态 数目 最 少 的 DFA。 
而 且 , 从 任意 一 个 接受 相同 语言 的 DFA 出 发 , 通过 分 组 合并 等 价 的 状态 , 我 们 总 是 可 以 构建 得 到 
这 个 状态 数 最 少 的 DFA, XF L((alb) *abb) , 图 3-63 就 是 状态 最 少 的 DFA, 将 图 3-36 中 DFA 
的 状态 划分 为 1A，C1 |B) |D} 1E} 然 后 合并 等 价 状态 就 可 以 得 到 这 个 最 小 DFA, 

我 们 将 给 出 一 个 将 任意 DEA 转化 为 等 价 的 状态 最 少 的 DFA 的 算法 。 该 算法 首先 创建 输入 DFA 
的 状态 集合 的 分 划 。 为 了 理解 这 个 算法 , 我 们 要 了 解 输 入 串 是 如 何 区 分 各 个 状态 的 。 如 果 分 别 从 状 
态 s 和 :+ 出 发 , 沿 着 标号 为 x 的 路 径 到 达 的 两 个 状态 中 只 有 一 个 是 接受 状态 , 我 们 说 串 * 区 分 状态 s$ 
和 t+。 如果 存 在 某 个 能 够 区 分 状态 5 和 状态 1 AYER, 那么 它们 就 是 可 区 分 的 ( distinguishable) 。 
DREJ 空 书 可 以 区 分 任何 一 个 接受 状态 和 非 接 受 状态 。 在 图 3-36 中 , H bb 区 分 状态 4 和 
B, 因为 从 4 出 发 经 过 标号 为 bb 的 路 径 会 到 达 非 接受 状态 C, 而 从 B 出 发 则 到 达 接 受 状态 。 口 

DFA 状态 最 小 化 算法 的 工作 原理 是 将 一 个 DFA 的 状态 集合 分 划 成 多 个 组 , 每 个 组 中 的 各 个 
状态 之 间 相互 不 可 区 分 。 然 后 , 将 每 个 组 中 的 状态 合并 成 状态 最 少 DFA 的 一 个 状态 。 算 法 在 执 
行 过 程 中 维护 了 状态 集合 的 一 个 分 划 ， 分 划 中 的 每 个 组 内 的 各 个 状态 尚 不 能 区 分 , 但 是 来 自 不 同 
组 的 任意 两 个 状态 是 可 区 分 的 。 当 任意 一 个 组 都 不 能 再 被 分 解 为 更 小 的 组 时 ， 这 个 分 划 就 不 能 
再 进一步 精 化 ,此 时 我 们 就 得 到 了 状态 最 少 的 DFA 

最 初 ， 访 分 划 包 含 两 个 组 : 接受 状态 组 和 非 接受 状态 组 。 算 法 的 基本 步 怠 是 从 当前 分 划 中 下 
一 个 状态 组 , 比如 4 = 15), 595 “ys%| ,并 选 定 某 个 输入 符号 a, 检查 a 是 否 可 以 用 于 区 分 4 中 
的 某 些 状态 。 我 们 检查 si, s2, s si 在 a。 上 的 转换 ,如 果 这 些 转换 到 达 的 状态 落 入 当前 分 划 的 
两 个 或 多 个 组 中 , 我 们 就 将 4 分 割 成 为 多 个 组 , 使 得 s As, 在 同一 组 中 当 且 仅 当 它们 在 a。 上 的 转 
换 都 到 达 同 一 个 组 的 状态 。 我 们 重复 这 个 分 割 过 程 , 直到 无 法 根据 某 个 输入 符号 对 任意 个 组 进 
行 分 割 为 止 。 这 个 思想 体现 在 下 面 的 算法 中 。 
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状态 最 小 化 算法 的 原理 

我 们 需要 证 明 两 个 性 质 : 仍然 位 于 psj 的 同 二 组 中 状态 不 可 能 被 任意 串 区 分 ， 以 及 最 后 
存在 于 不 同 子 集中 的 状态 之 间 是 可 区 分 的 。 要 证 明 第 一 个 性 质 , 需要 对 算法 3-39 中 步骤 2 的 
和 迭代 次 数 进行 归纳 。 如 果 在 步骤 2 的 第 i 次 迭代 之 后 s 和 4 在 同一 子 组 中 , 那么 就 不 存在 长 度 
小 于 等 于 i 的 串 可 以 将 s 和 4 区 分 开 。 请 读者 自行 完成 这 个 归纳 证 明 。 

第 二 个 性 质 的 证 明 也 是 通过 对 和 迭代 次 数 的 归纳 来 完成 的 。 如 果 在 步骤 2 的 第 i 次 迭代 时 
状态 s 和 上 被 放 在 不 同 的 组 中 , 那么 必然 存在 一 个 串 可 以 区 分 它们 。 归 纳 的 基础 很 容易 证 明 : 
当 s 和 4 放 在 初始 分 划 的 不 同 组 中 时 ,它们 必然 二 个 是 接受 状态 ; 另 一 个 是 非 接受 状态 。 因 ” 
此 < 就 可 以 区 分 它们 。 归 纳 步 又 如 下 : 必然 存在 一 个 输入 符号 a 和 状态 p、g, 使 得 ; 和 :在 输 
入 a 上 分 别 进 入 状态 和 g。 并 且 p Ag 必定 已 经 被 放 到 不 同 的 组 中 了 。 那 么 根据 归纳 假设 ， 
必然 存在 某 个 串 可 以 区 分 忆 和 gs 因此 可 知 ax 能 够 区 分 3 和 +。 











最 小 化 一 个 DFA 的 状态 数量 。 
输入 : 一 个 DFA D, 其 状态 集合 为 5, 输入 字母 表 为 I, 开 始 状态 为 56， 接受 状态 集 为 
输出 : 一 个 DFA D', 它 筷 接 受 相同 的 语言 , 且 状 态 数 最 少 。 
方法 : 
1) 首先 构造 包含 两 个 组 中 和 5 的 初始 划分 TL, 这 两 个 组 分 别 是 万 的 接受 状态 组 和 非 接 
受 状态 组 。 
2) 应 用 图 3-64 的 过 程 来 构造 新 的 分 划 Tre o 
最 初 , 令 Unew = I; 
for ( 开 中 的 每 个 组 C ) { 


将 G 分 划 为 更 小 的 组 ， 使 得 两 个 状态 s 和 在 同一 小 组 中 当 且 仅 当 对 于 所 有 
的 输入 符号 a， 状 态 s 和 + 在 上 的 转换 都 到 达 开 中 的 同一 组 ; 


/在 最 坏 情 况 下 ， 每 个 状态 各 自 组 成 一 个 组 */ 
在 Inew 中 将 G 替 换 为 对 G 进行 分 划 得 到 的 那些 小 组 ; 


} 





图 3-64 IT, 的 构造 
3) 如 果 Inev = M, S Wena = 开 并 接着 执行 步 又 4; 否则 , 用 IT 替换 I 并 重复 步骤 2。 
4) 在 分 划 IIsoul 的 每 个 组 中 选取 一 个 状态 作为 该 组 的 代表 。 这些 代表 构成 了 状态 最 少 DFA 
D' 的 状态 。D' 的 其 他 部 分 按 如 下 步骤 构建 : 

© D' 的 开始 状态 是 包含 了 D 的 开始 状态 的 组 的 代表 。 

D D' 的 接受 状态 是 那些 包含 了 D 的 接受 状态 的 组 的 代表 。 请 注意 , 每 个 组 中 要 么 只 包含 接 
ZRS, 要 么 只 包含 非 接受 状态 , 因为 我 们 一 开始 就 将 这 两 类 状态 分 开 了 , 而 图 3-64 中 
的 过 程 总 是 通过 分 解 已 经 构造 得 到 的 组 来 得 到 新 的 组 。 

© S s Æ Mina PESH C 的 代表 , IFS DFA D 中 在 输入 a 上 离开 的 转换 到 达 状态 Ar 
Ait SEA H RR. ABATED? 中 存在 一 个 从 * 到 ;在 输入 a 上 的 转换 。 注 意 , ZED 中， 
组 6 中 的 每 一 个 状态 必然 在 输入 a 上 进入 组 互 中 的 菜 个 状态 , 否则 , 组 G 应 该 已 经 被 图 
3-64 的 过 程 分 割 成 更 小 的 组 了 。 
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向 自己 的 非 接受 状态 。 从 技术 上 来 讲 ; 这 个 状态 是 必须 的 , 因为 在 一 个 DFA 中 , 从 每 个 状态 出 发 在 
每 个 输入 符号 上 都 必须 有 一 个 转换 。 然 而 ; 如 3.8.3 节 所 讨论 的 , 我 们 需要 知道 在 什么 时 候 已 经 不 
存在 被 这 个 DFA 接受 的 可 能 性 了 ; 这 样 我 们 才能 知道 已 经 识别 到 了 正确 的 词素 。 因 此 , 我 们 希望 
消除 死 状 态 , 并 使 用 一 个 缺少 某 些 转 换 的 自动 机 。 这 个 自动 机 的 状态 比 状态 最 少 DFA 的 状态 少 一 
个 ,但 是 因为 缺少 了 一 些 到 达 死 状态 的 转换 , 所 以 严格 地 讲 它 并 不 是 一 个 DFA, 














DEJ 让 我 们 重新 考虑 图 3-36 中 给 出 的 DFA。 初 始 分 划 包 括 两 个 组 | A, B,C, D}, {E}, 
它们 分 别 是 非 接受 状态 组 和 接受 状态 组 。 构 造 Mett, 图 3-64 中 的 过 程 考虑 这 两 个 组 和 输入 符 
号 a 和 4b。 因为 组 (E| 只 包含 一 个 状态 , 不 能 再 被 分 割 ， 所 以 |E| 被 原封 不 动 地 保留 在 Meto 

另 一 个 组 |4, B,C, D| 是 可 以 被 分 割 的 , 因此 我 们 必须 考虑 各 个 输入 符号 的 作用 。 在 输入 a 上 ， 
这 些 状态 中 的 每 一 个 都 转 到 B, 因此 使 用 以 a 开头 的 串 无 法 区 分 这 些 状态 。 但 对 于 输入 5, REA, B 
和 C 都 转 换 到 组 |4, B, C, DI 的 某 个 成 员 上 , 而 也 转 到 另 一 个 组 中 的 成 员 玉 上 。 因 此 在 et, 组 
|4, B, C, 中 被 分 割 为 14, B, CHAD} 。 这 一 轮 得 到 的 了,ew 是 |4, B,C} {D} IE}. 

在 下 一 轮 中 , 我 们 可 以 把 14, B, CANDIA, C1 18| ,因为 4 和 C 在 输入 5 上 都 到 达 |4， 
B,C| 中 的 元 素 , 但 B 却 转 到 另 一 个 组 中 的 元 素 D 上 。 因 此 在 第 二 轮 之 后 , Me = 1A, Ch LB 
[D] [E]. 在 第 三 轮 中 ,我 们 不 能 够 再 分 割 当前 分 划 中 唯一 一 个 包含 多 个 状态 的 组 {4, C| ,因为 
A 和 C 在 所 有 输入 上 都 进入 同一 个 状态 (因此 也 就 在 同一 组 中 ) 。 因 此 我 们 有 Hias 14, Cl iB) 
[D {E}. 

现在 我 们 将 构建 出 状态 最 少 DFA。 它 有 4 个 状态 ， 对 应 于 Hana 中 的 四 个 组 。 我 们 分 别 挑选 
4、B、 刀 和 巨 作 为 这 四 个 组 的 代表 ; 其 中 , 状态 4 是 开始 状态 ; 状态 是 唯一 的 接受 状态 。 它 的 
转换 函数 如 图 3-65 所 示 。 例 如 , 在 输入 5 上 离开 状态 E 的 转换 到 达 状 态 4， 因 为 在 原来 的 DFA 
H, 巨 在 输入 5 上 到 达 C, 而 4 是 C 所 在 组 的 代表 。 因 为 同样 的 原因 , 在 输入 5 上 离开 4 的 状态 
回 到 4 本 身 , 而 其 他 的 转换 都 和 图 3-36 中 的 相同 。 口 
3.9.7 ”词法 分 析 器 的 状态 最 小 化 

如 果 要 将 状态 最 小 化 算法 应 用 于 3. 8. 3 节 中 生成 的 DFA, 我 们 必须 在 算 
法 3. 39 中 使 用 不 同 的 初始 分 划 。 我 们 会 将 识别 某 个 特定 词法 单元 的 所 有 状 
态 放 到 对 应 于 此 词法 单元 的 一 个 组 中 , 同时 把 所 有 不 识别 任何 词法 单元 的 状 








态 放 到 另 一 组 。 下 面 用 一 个 例子 来 说 明 这 个 扩展 。 a TONN 
对 于 图 3-54 的 DFA, 初始 分 划 为 DFA 的 转换 表 


{0137, 7}{247}{8, 58}{68} {0} 

其 中 , 状态 0137 和 7 分 在 同一 组 的 原因 是 它们 都 没有 识别 任何 词法 单元 ; 状态 8 和 58 分 在 一 组 
的 原因 是 它们 都 识别 词法 单元 a*b + 。 请 注意 , 我 们 添加 了 一 个 死 状 态 Ø, 我 们 假设 它 在 输入 a 
和 时 会 转 到 它 自 身 。 这 个 死 状态 同时 也 是 状态 8、58 和 68 在 输入 a 上 的 目标 状态 。 

我 们 必须 将 0137 和 7 分 开 , 因为 它们 在 输入 a 上 转 到 不 同 的 组 。 我 们 也 要 把 8 和 58 分 开 ， 
因为 它们 在 输入 b 上 转 到 不 同 的 组 。 这 样 , 所 有 的 状态 都 自 成 一 组 。 图 3-54 所 示 的 DFA 就 是 识 
别 这 三 个 词法 单元 的 状态 最 少 DFA。 请 记 住 , 被 用 作词 法 分 析 器 的 DFA 通常 会 丢掉 它 的 死 状 态 ， 
同时 我 们 把 所 有 消失 的 转换 当 作 结 束 词法 单元 识别 过 程 的 信号 。 O 
3.9.8 DFA 模拟 中 的 时 间 和 空间 权衡 

最 简单 和 最 快捷 的 表示 一 个 DFA 的 转换 函数 的 方法 是 使 用 一 个 以 状态 和 字符 为 下 标的 二 维 表 。 
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给 定 一 个 状态 和 下 一 个 输入 字符 , 我 们 访问 这 个 数组 就 可 以 找 出 下 一 个 状态 以 及 我 们 必须 执行 的 特殊 
动作 , 比如 将 一 个 词法 单元 返回 给 语法 分 析 器 。 由 于 词法 分 析 器 的 DEA 中 通常 包含 数 百 个 状态 , 并 且 
涉及 ASCI 字母 表 中 的 128 个 输入 字符 , 因此 这 个 数组 需要 的 空间 少 于 一 兆 字 他。 

但 是 , 在 一 些小 型 的 设备 中 也 可 能 使 用 编译 器 。 对 于 这 些 设备 来 说 , 即使 一 兆 内 存 也 显得 太 
大 了 。 对 于 这 种 情况 , 可 以 应 用 很 多 方法 来 压缩 转换 表 。 比 如 , 我 们 可 以 用 一 个 转换 链表 来 表示 
每 个 状态 , 这 个 转换 链表 由 字符 - 状态 对 组 成 。 我 们 在 链表 的 最 后 存放 一 个 默认 状态 :对 于 没有 
出 现在 这 个 链表 中 的 字符 , 我 们 总 是 选择 这 个 状态 作为 目标 状态 。 

还 有 一 个 更 加 巧妙 的 数据 结构 , 它 既 利用 了 数组 表示 法 的 访问 速度 , 又 利用 了 带 默 认 值 的 链 
表 的 压缩 特性 。 我 们 可 以 把 这 个 结构 看 作 四 个 数组 , 如 图 3-66 所 示 呈 。 其 中 的 base 数组 用 于 确 
定 状 态 的 条 目的 基准 位 置 。 这 些 条 目 位 于 数组 next 和 check 中 。 如 果 数 组 check 告诉 我 们 由 
basel s] 给 出 的 基准 位 置 不 正确 , 那么 我 们 就 使 用 数组 default 来 确定 另 一 个 基准 位 置 。 

在 计算 nextstate(s, a) 时 ， 即 计算 状态 s 在 输入 a default base next check 
上 的 后 继 状 态 时 , 我 们 首先 查看 数组 next 和 check 中 


在 位 置 1 = base[s] + a 上 的 条 目 , 其 中 a 被 当 作 
0 ~127 之 间 的 整数 。 如 果 check[1] = s, 那么 这 个 条 | i 
目 是 有 效 的 , 状态 * 在 输入 & 上 的 后 继 状 态 就 是 - 























next[ 1]; 如 果 check[1] 关 s, 那么 我 们 得 到 男 一 个 状 7 t 
At = depaul[s]， 并 把 疙 当 作 当前 的 状态 重复 这 个 
过 程 。 函 数 nextState 的 定义 如 下 : lt hai 
int nestState(s,a) { 图 3-66 ”表示 转换 表 的 数据 结构 
if ( check{base[s] + a] == s ) return neztlbasels] + a]; 


else return nextState(default|s], a); 


} 

使 用 图 3-66 中 所 示 数 据 结 构 的 目的 是 利用 状态 之 间 的 相似 性 来 缩短 next-check 数组 。 例 如 ， 
s 状态 的 默认 状态 上 可 能 是 一 个 “正在 处 理 一 个 标识 符 ” 的 状态 , 就 像 图 3-14 中 的 状态 10。 而 状态 
s 可 能 是 在 读 人 字母 th 之 后 进入 的 状态 。 这 里 th 既是 关键 字 then 的 二 个 前 级 ,同时 也 可 能 是 
二 个 标识 符 的 词素 的 前 缀 。 当 输入 字符 为 s 时 , 我 们 必须 从 状态 s 到 达 二 个 特别 的 状态 。 该 状 
态 记 住 我 们 已 经 看 到 了 the; 当 输入 字符 不 等 于 e 时 , 状态 s 的 动作 和 状态 t 的 动作 相同 。 因 此 ， 
我 们 将 check[ base[s] +e ] 的 值 设置 为 s( 以 确认 这 个 条 目 对 于 状态 s AR), 并 将 next 
[ base[ s] +e ] 的 值 置 为 前 面 提 到 的 特殊 状态 。 同 时 default[s] 被 设置 为 | 

虽然 我 们 可 能 无 法 选择 适当 的 base 值 , 使 next = check 的 所 有 条 目 都 被 充分 利用 。 经 验 表明 ， 
采用 下 述 简单 策略 就 可 以 有 很 好 的 效果 : 按照 顺序 将 base 值 赋 给 各 个 状态 , 将 各 个 basel s | 的 值 
设置 为 最 小 的 、 能 够 使 得 状态 s 的 特殊 条 目的 位 置 都 尚未 被 占用 的 值 。 这 个 策略 需要 的 空间 只 比 
最 小 可 能 值 多 一 点 点 。 
3.9.9 3.9 SHAS 

练习 3. 9. 1: 扩展 图 3-58 PHK, 使 得 它 包含 如 下 运算 符 ; 

Ly 

2) + 

练习 3.9.2: 使 用 算法 3. 36 HAY 3.7.3 中 的 正则 表达 式 直接 转换 成 DFA。 





O 在 实践 中 可 能 还 有 另 一 个 以 状态 为 下 标的 数组 ， 如 果 某 个 状态 相关 的 动作 , 那么 这 个 数组 的 相应 元 素 会 指明 这 个 动作 。 
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! 练习 3.9.3: 我 们 只 需要 说 明 两 个 正则 表达 式 的 最 少 状 态 DFA 同 构 , 就 可 以 证 明 这 两 个 正 
则 表达 式 等 价 。 使 用 这 种 方法 来 证 明 下 面 的 正则 表达 式 (alb)*, (a*1lb*)* 以 及 ((ela)b*)* 
相互 等 价 。 注 意 : 你 可 能 已 经 在 完成 练习 3.7.3 时 构造 出 了 这 些 表达 式 的 DFA, 

| 练习 3. 9.4: 为 下 列 的 正则 表达 式 构造 最 少 状态 DFA: 

1) (alb) * a(alb) 

2) (alb) *a(alb)(alb) 

3) (alb) *a(alb)(alb) (alb) 

你 有 没有 看 出 什么 规律 ? 

1! 练习 3.9:5: 为 了 证 明 例 3.25 中 非 正式 给 出 的 结论 , 说 明正 则 表达 式 

(alb)*a(a|b)(alb) - -- (alb) 

的 任何 DFA 至 少 具有 2" 个 状态 。 在 这 个 正则 表达 式 中 , (alb) 在 其 尾部 出 现 了 n-1 次 。 提 
T: 观察 练习 3.9.4 中 的 规律 。 各 个 状态 分 别 表示 了 关于 已 输入 串 的 哪些 信息 ? 


3. 10 


第 3 章 章 总 结 


词法 单元 。 词法 分 析 器 扫描 源 程序 并 输出 一 一 个 由 词法 单元 组 成 的 序列 。 这 些 词 法 单元 通 
常会 逐个 传送 给 语法 分 析 器 6。 有 些 词法 单元 只 包含 一 个 词法 单元 名 , 而 其 他 词法 单元 还 
T RERNE, ¥ 已 给 出 了 在 输入 中 找到 的 这 个 词法 单元 的 某 个 实例 的 有 关 信息 。 
词素 。 每 次 词法 分 析 器 向 语法 分 析 器 返回 一 个 词法 单元 时 , 该 词法 单元 都 有 一 个 关联 的 
词素 , 即 该 词法 单元 所 代表 的 输入 字符 串 。 
缓冲 技术 。 为 了 判断 下 一 个 词素 在 何 处 结束 , 常常 需要 预先 扫描 输入 字符 。 因 此 , 词法 
分 析 器 往往 需要 对 输入 字符 进行 缓冲 。 可 以 使 用 两 个 技术 来 加 速 输入 扫描 过 程 : 循环 使 
用 一 对 缓冲 区 ， 以 及 在 每 个 缓冲 区 末尾 放置 特殊 的 哨兵 标记 字符 。 该 字符 可 以 通知 词法 
分 析 器 已 经 到 达 了 缓冲 区 末尾 。 
模式 。 每 个 词法 单元 都 有 一 个 模式 ， 它 描述 了 什么 样 的 字符 序列 可 以 组 成 对 应 于 此 词法 
单元 的 词素 。 那 些 和 一 个 给 定 模式 匹配 的 字 ( 或 者 说 字符 串 ) 的 集合 称 为 该 模式 的 语言 。 
ENKAR, 这 些 表 达 式 常用 于 描述 模式 。 正 则 表达 式 是 从 单个 字符 开始 , 通过 并 、 连 
He, Kleene 闭 包 、“ 重 复 多 次 ”等 运算 符 构 造 得 到 的 。 
正则 定义 。 多 个 语言 的 复杂 集合 ， 比 如 用 以 描述 一 个 程序 设计 语言 所 有 词法 单元 的 多 个 模式 常 
常 是 通过 正则 定义 来 描述 的 。 一 个 正则 定义 是 二 个 语句 序列 , 其 中 的 每 个 语句 定义 了 一 个 表 
示 某 正则 表达 式 的 变量 。 定 义 一 个 变量 的 正则 表达 式 时 可 以 使 用 已 经 定义 过 的 变量 。 
扩展 的 正则 表达 式 表示 法 。 为 了 使 正则 表达 式 更 易于 表达 模式 , 一些 附加 的 运算 符 可 以 
作为 缩写 在 正则 表达 式 中 使 用 。 比 如 + (一 个 或 多 个 )、? ( 零 个 或 一 个) 以 及 字符 类 (由 
特定 字符 集中 单个 字符 组 成 的 字符 串 的 集合 ) 。 
状态 转换 图 。 一 个 词法 分 析 器 的 行为 经 常 可 以 用 一 个 状态 转换 图 来 描述 。 它 有 多 个 状 
态 。 在 搜寻 可 能 与 某 个 模式 匹配 的 词素 的 过 程 中 ; 各 个 状态 代表 了 已 读 入 字符 的 历史 信 
息 。 它 同时 具有 多 条 从 一 个 状态 到 达 另 一 个 状态 的 转换 (箭头 ) 。 每 个 转换 都 指明 了 下 一 
个 可 能 的 输入 字符 , 该 字符 将 使 词法 分 析 器 改变 当前 状态 。 
有 穷 自动 机 。 它 是 状态 转换 图 的 形式 化 表示 。 它 指明 了 一 个 开始 状态 、 一 个 或 多 个 接受 
RE, 以 及 状态 集 、 输 入 字符 集 和 状态 间 的 转换 集合 。 接 受 状态 表明 已 经 发 现 了 和 某 个 
词法 单元 对 应 的 词素 。 与 状态 转换 图 不 同 , 有 穷 自动 机 既 可 以 在 输 太 字符 上 执行 转换 ， 
也 可 以 在 空 输入 上 执行 转换 。 
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。 确定 有 穷 自动 机 。 一 个 确定 有 穷 自动 机 是 一 种 特殊 的 有 穷 自 动机 。 它 的 任何 一 个 状态 对 
于 任意 一 个 输入 符号 有 且 只 有 一 个 转换 。 同时 它 不 允许 在 空 输入 上 的 转换 。 确 定 有 穷 自 
动机 类 似 于 状态 转换 图 , 对 它 的 模拟 相对 容易 ， 因此 适 于 作为 词法 分 析 器 的 实现 基础 。 
不 确定 有 穷 自 动机 。 不 是 确定 有 穷 自 动机 的 自动 机 称 为 不 确定 的 。NFA 通常 要 比 确定 有 
穷 自动 机 更 容易 设计 。 词 法 分 析 器 的 男 一 种 体系 结构 如 下 : 对 应 于 各 个 可 能 模式 都 有 一 
个 NFA, 并 且 我 们 使 用 表格 来 记录 这 些 NFA 在 扫描 输入 字符 时 可 能 进入 的 所 有 状态 。 
模式 表示 方法 之 间 的 转换 。 我 们 可 以 把 任意 一 个 正则 表达 式 转换 为 一 个 大 小 基本 相同 的 
NFA, 这 个 NFA 识别 的 语言 和 该 正则 表达 式 识别 的 相同 。 更 进一步 , 任何 NFA 都 可 以 转 
换 为 一 个 代表 相同 模式 的 DFA, 虽然 在 最 坏 的 情况 下 自动 机 的 大 小 会 以 指数 级 增长 , 但 
是 在 常见 的 程序 设计 语言 中 尚未 碰 到 这 些 情况 。 可 以 将 任意 一 个 确定 或 不 确定 有 穷 自动 
机 转化 为 一 个 正则 表达 式 , 使 得 该 表达 式 定义 的 语言 和 这 个 自动 机 识别 的 语言 相同 。 

Lex。 有 一 系列 的 软件 系统 , 包括 Lex 和 Flex， 可 以 作为 生成 词法 分 析 器 的 工具 。 用 户 通 
过 扩展 的 正则 表达 式 来 描述 各 种 词法 单元 的 模式 。Lex 将 这 些 表达 式 转化 为 词法 分 析 器 。 
这 个 分 析 器 实质 上 是 一 个 可 以 识别 所 有 模式 的 确定 有 穷 自动 机 。 

有 穷 自 动机 的 最 小 化 。 对 于 每 一 个 DFA, 都 存在 一 个 接受 同样 语言 的 最 少 状态 DFA 不仅 
如 此 , 一 个 给 定语 言 的 最 少 状态 DFA( 不 计 同 构 ) 是 唯一 的 。 
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正则 表达 式 首先 由 Kleene 在 20 世纪 50 年 代 开始 研究 [9] McCullough 和 Pitts[ 12] 提 出 了 一 
种 描述 神经 活动 的 有 穷 自动 机 模型 ,而 Kleene 的 兴趣 就 是 描述 那些 可 以 用 这 些 模型 表示 的 事件 。 
从 那 以 后 ; 正则 表达 式 和 有 穷 自动 机 在 计算 机 科学 中 得 到 了 广泛 应 用 。 

各 种 各 样 的 正则 表达 式 已 经 应 用 于 很 多 流行 的 UNIX 工具 中 , 比如 awk、ed、egrep、grep、lex、 
sed, sh 和 vi 等 。 可 移动 操作 系统 接口 ( Portable Operating System Interface , POSIX ) 的 标准 文档 
IEEE 1003 $ ISO/IEC 9945 中 定义 了 POSIX 扩展 正则 表达 式 , 它们 和 最 初 的 UNIX 正则 表达 式 非 
常 相近 , 只 有 少量 例外 ,比如 字符 类 的 助 记 表 示 方 式 。 许 多 脚本 语言 , 像 Per 、Python 和 Tel, 都 
采用 了 正则 表达 式 , 但 常常 使 用 不 兼容 的 扩展 表示 方式 。 

我 们 熟悉 的 有 穷 自 动机 模型 和 算法 3. 39 中 的 有 穷 自动 机 最 小 化 方法 由 Huffman[ 6] 和 Moore 
[14] 给 出 。 而 Rabin 和 Scott[15] 最 先 提 出 了 不 确定 有 穷 自动 机 的 概念 ,他们 还 给 出 了 子 集 构造 
法 , 即 算法 3. 29。 这 个 算法 证 明了 确定 自动 机 和 不 确定 自动 机 在 语言 识别 能 力 上 是 等 价 的 。 

McNaughton 和 Yamada[ 13] 最 先 给 出 了 一 个 利用 正则 表达 式 直接 构造 DFA 的 算法 。3.9 节 中 
描述 的 算法 3. 36 最 早 被 Aho 用 于 构建 UNIX 正则 表达 式 匹 配 工具 egrep, 这 个 算法 还 被 应 用 于 
awk[3] 中 的 正则 表达 式 模 式 匹 配 例 程 。 将 不 确定 自动 机 用 作 中 间 表 示 的 匹配 方法 首先 由 
Thompson[ 17] 提 出 。 该 文 还 提出 了 直接 模拟 NFA 的 算法 (算法 3: 22) 。 这 个 算法 被 Thompson 用 
于 文本 编辑 器 QED 中 。 

Lesk 开发 了 Lex 的 第 一 个 版 本 , 随后 Lesk 和 Schmidt 用 算法 3. 36 编写 了 Lex 的 第 二 个 版 本 
[10] 。 此 后 出 现 了 Lex 的 很 多 变 体 。GNU 版 本 的 Flex 及 其 文档 可 以 在 [4] 下载。 流行 的 Lex 的 
Java 版 本 包括 JFlex[ 7] Al JLex[8]. 

在 3.4 节 的 练习 3.4. 3 之 前 讨论 的 KMP 算法 来 自 [11]。 可 处 理 多 个 关键 字 的 此 算法 的 扩展 
版 本 可 以 在 [2] 中 找到 。Aho 在 UNIX 工具 fgrep 的 第 一 个 实现 中 使 用 了 这 个 算法 。 

在 [5] 中 完整 地 介绍 了 有 关 有 穷 自动 机 和 正则 表达 式 的 理论 , 而 [1] 给 出 了 字符 串 匹 配 技术 
的 概述 。 


120 第 3 章 





1. Aho, A. V., “Algorithms for finding patterns in strings,” in Handbook of 
Theoretical Computer Science (J. van Leeuwen, ed.), Vol. A, Ch. 5, MIT 


Press, Cambridge, 1990. 


2. Aho, A. V. and M. J. Corasick, “Efficient string matching: an aid to 
bibliographic search,” Comm. ACM 18:6 (1975), pp. 333-340. 


3. Aho, A. V., B. W. Kernighan, and P. J. Weinberger, The AWK Program- 
ming Language, Addison-Wesley, Boston, MA, 1988. 


4. Flex home page http://www.gnu. org/software/flex/, Free Software 
Foundation. 


5. Hopcroft, J. E., R. Motwani, and J. D. Ullman, Introduction to Automata 
Theory, Languages, and Computation, Addison-Wesley, Boston MA, 2006. 


6. Huffman, D. A., “The synthesis of sequential machines,” J. Franklin Inst. 
257 (1954), pp. 3-4, 161, 190, 275-303. 


7. JFlex home page http://jflex.de/. 
8. http://www.cs.princeton.edu/~appel/modern/java/JLex . 
9. Kleene, S. C., “Representation of events in nerve nets,” in [16], pp. 3-40. 


10. Lesk, M. E., “Lex — a lexical analyzer generator,” Computing Science 
Tech. Report 39, Bell Laboratories, Murray Hill, NJ, 1975. A similar 
document with the same title but with E. Schmidt as a coauthor, appears 
in Vol. 2 of the Unix Programmer’s Manual, Bell laboratories, Murray Hill 
NJ, 1975; see http: //dinosaur.compilertools.net/lex/index.html . 


11. Knuth, D. E., J. H. Morris, and V. R. Pratt, “Fast pattern matching in 
strings,” SIAM J. Computing 6:2 (1977), pp. 323-350. 


12. McCullough, W. S. and W. Pitts, “A logical calculus of the ideas imma- 
nent in nervous activity,” Bull. Math. Biophysics 5 (1943), pp. 115-133. 


13. McNaughton, R. and H. Yamada, “Regular expressions and state graphs 
for automata,” IRE Trans. on Electronic Computers EC-9:1 (1960), pp. 
38-47. 


14. Moore, E. F., “Gedanken experiments on sequential machines,” in [16], 
pp. 129-153. 


15. Rabin, M. O. and D. Scott, “Finite automata and their decision prob- 
lems,” IBM J. Res. and Devel. 3:2 (1959), pp. 114-125. 


16. Shannon, C. and J. McCarthy (eds.), Automata Studies, Princeton Univ. 
Press, 1956. 


17. Thompson, K., “Regular expression search algorithm,” Comm. ACM 11:6 
(1968), pp. 419-422. 


第 4 章 语法 分 析 


本 章 介绍 的 语法 分 析 方 法 通常 用 于 编译 器 中 。 我 们 首先 介绍 基本 概念 ， 然 后 介绍 适合 手工 
实现 的 技术 , 最 后 介绍 用 于 自动 化 工具 的 算法 。 因 为 源 程序 可 能 包含 语法 错误 , 所 以 我 们 还 将 讨 
论 如 何 扩展 语法 分 析 方 法 , 以 便 从 常见 错误 中 恢复 。 

在 设计 语言 时 , 每 种 程序 设计 语言 都 有 一 组 精确 的 规则 来 描述 良 构 ( well-formed ) 程序 的 语法 
结构 。 比 如 , 在 C 语言 中 ;一 个 程序 由 多 个 函数 组 成 , 一 个 函数 由 声明 和 语句 组 成 ,一 个 语句 由 
表达 式 组 成 , 等 等 。 程 序 设计 语言 构造 的 语法 可 以 使 用 2.2 节 中 介绍 的 上 下 文 无 关 文 法 或 者 BNF 
( 巴 库 斯 - 责 尔 范式 ) 表 示 法 来 描述 。 文 法 为 语言 设计 者 和 编译 器 编写 者 都 提供 了 很 大 的 便利 。 

。 文 法 给 出 了 一 个 程序 设计 语言 的 精确 易 懂 的 语法 规约 。 

。 对 于 某 些 类 型 的 文法 ,我 们 可 以 自动 地 构造 出 高 效 的 语法 分 析 器 ， 它 能 够 确定 一 个 源 程序 

的 语法 结构 。 同 时 ,语法 分 析 器 的 构造 过 程 可 以 揭示 出 语法 的 二 义 性 ,同时 还 可 能 发 现 _ 
些 容易 在 语言 的 初始 设计 阶段 被 忽略 的 问题 。 

。 一 个 正确 设计 的 文法 给 出 了 一 个 语言 的 结构 。 该 结构 有 助 于 把 源 程序 翻译 为 正确 的 目标 

代码 , 也 有 助 于 检测 错误 。 

© 一 个 文法 支持 逐步 加 入 可 以 完成 新 任务 的 新 语言 构造 从 而 迭代 地 演化 和 开发 语言 。 如 果 

对 语言 的 实现 遵循 语言 的 文法 结构 , 那么 在 实现 中 加 入 这 些 新 构造 的 工作 就 变 得 更 加 
容易 。 


4.1 引 论 


在 本 节 中 , 我 们 将 探讨 语法 分 析 器 是 如 何 集成 到 一 个 典型 的 编译 器 中 的 。 然后 我 们 将 研究 
算术 表达 式 的 典型 文法 。 通过 表达 式 文法 已 经 足以 说 明 语 法 分 析 的 本 质 , 因为 处 理 表达 式 的 语 
法 分 析 技 术 可 以 用 于 处 理 程序 设计 语言 的 大 部 分 构造 。 这 一 节 的 最 后 将 讨论 错误 处 理 的 问题 ， 
因为 当 语 法 分 析 器 发 现 它 的 输入 不 能 由 它 的 文法 生成 时 , 它 必须 作出 适当 的 反应 。 

4.1.1 语法 分 析 器 的 作用 

在 我 们 的 编译 器 模型 中 ， 语法 分 析 器 从 词法 分 析 器 获得 一 个 由 词法 单元 组 成 的 串 ， 并 验证 这 
个 串 可 以 由 源 语言 的 文法 生成 , 如 图 4-1 所 示 。 我 们 期 望 语 法 分 析 器 能 够 以 易于 理解 的 方式 报告 
语法 错误 , 并 且 能 够 从 常见 的 错误 中 恢复 并 继续 处 理 程序 的 其 余部 分 。 从 概念 上 讲 , 对 于 良 构 的 
程序 , 语法 分 析 器 构造 出 一 棵 语法 分 析 树 ， 并 把 它 传递 给 编译 器 的 其 他 部 分 进一步 处 理 。 实 际 
上 ,并 不 需要 显 式 地 构造 出 这 棵 语法 分 析 树 , 因为 正如 我 们 将 看 到 的 ， 对 源 程序 的 检查 和 翻译 动 
作 可 以 和 语法 分 析 过 程 交 错 完成 。 因 此 ， 语法 分 析 器 和 前 端的 其 他 部 分 可 以 用 一 个 模块 来 实现 。 

处 理 文法 的 语法 分 析 器 大 体 上 可 以 分 为 三 种 类 型 : 通用 的 、 自 顶 向 下 的 和 自 底 向 上 的 。 像 
Cocke-Younger-Kasami 算法 和 Earley 算法 这 样 的 通用 语法 分 析 方法 可 以 对 任意 文法 进行 语法 分 析 
( 见 参考 文献 ) 。 然 而 , 这 些 通用 方法 效率 很 低 , 不 能 用 于 编译 器 产品 。 

编译 器 中 常用 的 方法 可 以 分 为 自 顶 向 下 的 和 自 底 向 上 的 。 顾名思义 ， 自 顶 向 下 的 方法 从 语 
法 分 析 树 的 顶部 ( 根 结 点 ) 开始 向 底部 (叶子 结 点 ) 构 造 语法 分 析 树 ， 而 自 底 向 上 的 方法 则 从 叶子 
结 点 开始 , 逐渐 向 根 结 点 方向 构造 。 这 两 种 分 析 方法 中 ， 语法 分 析 器 的 输入 总 是 按照 从 左 向 右 的 
方式 被 扫描 , 每 次 扫描 一 个 符号 。 
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图 4-1 编译 器 模型 中 语法 分 析 器 的 位 置 


高 效 的 自 顶 向 下 方法 和 自 底 向 上 方法 只 能 处 理 某 些 文法 子 类 , 但 其 中 的 某 些 子 类 , 特别 是 
ti ie LR 文法 , 其 表达 能 力 已 经 足以 描述 现代 程序 设计 语言 的 大 部 分 语法 构造 了 。 手 工 实现 的 
语法 分 析 器 通常 使 用 LL 文法。 比如, 2. 4.2 节 中 的 预测 语法 分 析 方 法 能 够 处 理 LL 文法。 处理 较 
大 的 LR 文法 类 的 语法 分 析 器 通常 是 使 用 自动 化 工具 构造 得 到 的 。 

在 本 章 中 , 我 们 假设 语法 分 析 器 的 输出 是 语法 分 析 树 的 某 种 表示 形式 。 该 语法 分 析 树 对 应 
于 来 自 词法 分 析 器 的 词法 单元 流 。 在 实践 中 , 语法 分 析 过 程 中 可 能 包括 多 个 任务 ， 比 如 将 不 同 词 
法 单元 的 信息 收集 到 符号 表 中 ,进行 类 型 检查 和 其 他 类 型 的 语义 分 析 , 以 及 生成 中 间 人 代码。 我们 
把 所 有 这 些 活动 都 归纳 到 图 4-1 中 的 “前 端的 其 余部 分 ”里 面 。 在 后 续 几 章 中 将 详细 讨论 这 些 
活动 。 

4.1.2 代表 性 的 文法 

为 了 便于 参考 , 我 们 先 给 出 一 些 即将 在 本 章 中 加 以 研究 的 文法 。 对 那些 以 while 或 int 这 样 
的 关键 字 开 头 的 构造 进行 语法 分 析 相 对 容易 ,因为 关键 字 可 以 引导 我 们 选择 适当 的 文法 产生 式 
来 匹配 输入 。 因 此 我 们 主要 关注 表达 式 。 因 为 运算 符 的 结合 性 和 优先 级 ， 表达 式 的 处 理 更 具 挑 
战 性 。 

下 面 的 文法 指明 了 运算 符 的 结合 性 和 优先 级 。 这 个 文法 和 我 们 在 第 2 章 中 使 用 的 描述 表达 
式 、 项 和 因子 的 文法 类 似 。E 表示 一 组 以 + 号 分 隔 的 项 所 组 成 的 表达 式 ; 7 表示 由 一 组 以 * 号 分 
隔 的 因子 所 组 成 的 项 ; 而 下 表示 因子 , 它 可 能 是 括号 括 起 的 表达 式 , 也 可 能 是 标识 符 : 

ERA Tol oF 
ToT*F\F (4.1) 
F-+(E) | id 
表达 式 文法 (4. 1) WR LR aE, 适用 于 目 底 向 上 的 语法 分 析 技 术 。 这 个 文法 经 过 修改 可 以 处 
理 更 多 的 运算 符 和 更 多 的 优先 级 层次 。 然 而 , 它 不 能 用 于 自 项 向 下 的 语法 分 析 , 因为 它 是 左 递 
归 的 。 
下 面 给 出 表达 式 文法 (4.1) 的 无 左 递归 版 本 , 该 版 本 将 被 用 于 自 顶 向 下 的 语法 分 析 : 
ETE 
Em + TE le 
TFT (4.2) 
T'— * FT’ le 
F(E) | id 

下 面 的 文法 以 相同 的 方式 处 理 + 和 * ,因此 它 可 以 用 来 说 明 那 些 在 语法 分 析 过 程 中 处 理 二 
义 性 的 技术 : 

ESE +E\E*E\(E)\id (4.3) 
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这 里 的 瓦 表 示 各 种 类 型 的 表达 式 。 文 法 (4. 3) 允许 一 个 表达 式 , 比如 a +b*c, 具有 多 棵 语法 分 
析 树 。 
4.1.3 语法 错误 的 处 理 

未 节 的 其 余部 分 将 考虑 语法 错误 的 本 质 以 及 错误 恢复 的 一 般 策略 。 其 中 的 两 种 策略 分 别称 
为 恐慌 模式 和 短语 层次 恢复 。 它们 将 和 特定 的 语法 分 析 方法 一 起 详细 讨论 。 

如 果 编 译 器 只 处 理 正确 的 程序 ， 那么 它 的 设计 和 实现 将 会 大 大 简化 。 但 是 , 人 们 还 期 望 编译 
器 能 够 帮助 程序 员 定 位 和 跟踪 错误 。 因 为 不 管 程序 员 如 何 努 力 ， 程序 中 难免 会 有 错误 。 令 人 惊 
奇 的 是 , 虽然 错误 如 此 常见 ， 但 很 少 有 语言 在 设计 的 时 候 就 考虑 到 错误 处 理 问题 。 如 果 我 们 的 口 
语 也 像 计 算 机 语言 那样 对 语法 精确 性 有 要 求 ， 那么 我 们 的 文明 就 会 大 不 相同 。 大 部 分 程序 设计 
语言 的 规范 没有 规定 编译 器 应 该 如 果 处 理 错误 ; 错误 处 理 方法 由 编译 器 的 设计 者 决定 。 从 一 开 
始 就 计划 好 如 何 进 行 错误 处 理 不 仅 可 以 简化 编译 器 的 结构 ,还 可 以 改进 错误 处 理 方法 。 
程序 可 能 有 不 同 层次 的 错误 。 
。 词法 错误 ,包括 标识 符 、 关 键 字 或 运算 符 拼 写 错误 ( 比如 把 标识 符 ellipsesize 写成 
elipseSize) 和 没有 在 字符 串 文本 上 正确 地 加 上 引号 。 
。 语法 错误 ,包括 分 号 放 错 地 方 、 花 括号 ， 即 “| ”或 “1 ERRERA o A-TC 语言 或 
Java 语 言 中 的 语法 错误 的 例子 是 一 个 case 语句 的 外 围 没 有 相应 的 switch 语句 (然而 ， 
语法 分 析 器 通常 允许 这 种 情况 出 现 ， 当 编译 器 在 之 后 要 生成 代码 时 才 会 发 现 这 个 错误 ) 。 
。 语义 错误 , 包括 运算 符 和 运算 分 量 之 间 的 类 型 不 匹配 。 例 如 ,返回 类 型 为 void 的 某 个 
Java 方 法 中 出 现 了 一 个 返回 某 个 值 的 return 语句 。 
。 逻辑 错误 ,可 以 是 因 程序 员 的 错误 推理 而 引起 的 任何 错误 。 比 如 在 一 个 C 程序 中 应 该 使 
用 比较 运算 符 == 的 地 方 使 用 了 赋值 运算 符 = 。 这 样 的 程序 可 能 是 良 构 的 , 但 是 却 没有 正 
确 反 映 出 程序 员 的 意图 。 
语法 分 析 方法 的 精确 性 使 得 我 们 可 以 非常 高 效 地 检测 出 语法 错误 。 有 些 语法 分 析 方法 ， 比 
如 LL 和 LR 方法 , 能 够 在 第 一 时 间 发 现 错误 。 也 就 是 说 ， 当 来 自 词法 分 析 器 的 词法 单元 流 不 能 根 
据 该 语言 的 文法 进一步 分 析 时 就 会 发 现 错误 。 更 精确 地 讲 , 它们 具有 可 行 前 级 特性 (viable-prefix 
property) ,也 就 是 说 ， 一 旦 它们 发 现 输入 的 某 个 前 级 不 能 够 通过 添加 一 些 符号 而 形成 这 个 语言 
EB, 就 可 以 立刻 检测 到 语法 错误 。 

要 重视 错误 恢复 的 另 一 个 原因 是 ,不 管 产生 错误 的 原因 是 什么 , 很 多 错误 都 以 语法 错误 的 方 
式 出 现 , 并 且 在 不 能 继续 进行 语法 分 析 时 暴露 出 来 。 有 些 语义 错误 (比如 类 型 不 匹配 ) 也 可 以 被 
高 效 地 检测 到 。 然 而 , 总 的 来 说 , 在 编译 时 精确 地 检测 出 语义 错误 和 逻辑 错误 是 很 困难 的 。 

语法 分 析 器 中 的 错误 处 理 程序 的 目标 说 起 来 很 简单 , 但 实现 起 来 却 很 有 挑战 性 : 

o 清晰 精确 地 报告 出 现 的 错误 。 

© 能 很 快 地 从 各 个 错误 中 恢复 , 以 继续 检测 后 面 的 错误 。 

e 尽 可 能 少 地 增加 处 理 正确 程序 时 的 开销 。 

幸运 的 是 , 常见 的 错误 都 很 简单 , 使 用 相对 直接 的 错误 处 理 机 制 就 足以 达到 目标 。 

一 个 错误 处 理 程序 应 该 如 何 报告 出 现 的 错误 ? 至 少 , 它 必须 报告 在 源 程序 的 什么 位 置 检测 
到 错误 ， 因 为 实际 的 错误 很 可 能 就 出 现在 这 个 位 置 之 前 的 几 个 词法 单元 处 。 一 个 常用 的 策略 是 
打印 出 有 问题 的 那 一 行 , 然后 用 一 个 指针 指向 检测 到 错误 的 地 方 。 
4.1.4 错误 恢复 策略 

当 检 测 到 一 个 错误 时 , 语法 分 析 器 应 该 如 何 恢复 ? 虽然 还 没有 哪个 策略 能 够 证 明 自 己 是 被 
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普遍 接受 的 , 但 有 一 些 方法 的 适用 范围 很 广 。 最 简单 的 方法 是 让 语法 分 析 器 在 检测 到 第 二 个 错 
误 时 给 出 错误 提示 信息 , 然后 退出 。 如 果 语 法 分 析 器 能 够 把 自己 恢复 到 某 个 状态 , 且 有 理由 预期 
从 那里 开始 继续 处 理 输入 将 提供 有 意义 的 诊断 信息 , 那么 它 通常 会 发 现 更 多 的 错误 。 如果 错误 
太 多 , 那么 最 好 让 编译 器 在 超过 某 个 错误 数量 上 界 之 后 停止 分 析 。 这 样 做 要 比 让 编译 器 产生 大 
量 恼人 的 “可 疑 ”错误 信息 更 好 。 

恐慌 模式 的 恢复 

使 用 这 个 方法 时 , 语法 分 析 器 一 旦 发 现 错误 就 不 断 丢 弃 输入 中 的 符号 , 一 次 丢弃 一 个 符号 ， 
直到 找到 同步 词法 单元 (synchronizing token) 集合 中 的 某 个 元 素 为 止 。 同步 词法 单元 通常 是 界限 
符 ; 比如 分 号 或 者 | 。 它 们 在 源 程序 中 的 作用 是 清晰 、 无 二 义 的 。 编 译 器 的 设计 者 必须 为 源 语言 
选择 适当 的 同步 词法 单元 。 恺 慌 模 式 的 错误 纠正 方法 常常 会 跳 过 大 量 输入 , 不 检查 被 跳 过 部 分 
的 其 他 错误 。 但 是 它 很 简单 ， 并 且 能 够 保证 不 会 进入 无 限 循环 。 我 们 稍 后 考虑 的 某 些 方法 则 不 
一 定 能 保证 不 进入 无 限 循 环 。 

短语 层次 的 恢复 

当 发 现 一 个 错误 时 ,语法 分 析 器 可 以 在 余下 的 输入 上 进行 局 部 性 纠正 。 也 就 是 说 ， 它 可 能 将 
余下 输入 的 某 个 前 缀 替换 为 另 一 个 串 ， 使 语法 分 析 器 可 以 继续 分 析 。 常用 的 局 部 纠正 方法 包括 
将 一 个 逗号 蔡 换 为 分 号 、 删 除 一 个 多 余 的 分 号 或 者 插入 一 个 遗漏 的 分 号 。 如 何 选择 局 部 纠正 方 
法 是 由 编译 器 设计 者 决定 的 。 当 然 , 我 们 必须 小 心 选择 蔡 换 方法 , 以 避免 进入 无 限 循环 。 比如 ， 
如 果 我 们 总 是 在 当前 输入 符号 之 前 插入 符号 ,就 会 出 现 无 限 循环 。 

短语 层次 替换 方法 已 经 在 多 个 错误 修复 型 编译 器 中 使 用 , 它 可 以 纠正 任何 输入 串 。 它 主要 
的 不 足 在 于 它 难以 处 理 实际 错误 发 生 在 被 检测 位 置 之 前 的 情况 。 

错误 产生 式 

通过 预测 可 能 遇 到 的 常见 错误 , 我 们 可 以 在 当前 语言 的 文法 中 加 入 特殊 的 产生 式 。 这 些 产 
生 式 能 够 产生 含有 错误 的 构造 ,从 而 基于 增加 了 错误 产生 式 的 文法 构造 得 到 一 个 语法 分 析 器 。 如 
果 语 法 分 析 过 程 中 使 用 了 某 个 错误 产生 式 , 语法 分 析 器 就 检测 到 了 一 个 预期 的 错误 。 语法 分 析 
器 能 够 据 此 生成 适当 的 错误 诊断 信息 , 指出 在 输入 中 识别 出 的 错误 构造 。 

全 局 纠正 

在 理想 情况 下 , 我 们 和 希望 编译 器 在 处 理 一 个 错误 输入 串 时 通过 最 少 的 改动 将 其 转化 为 语法 
正确 的 串 。 有 些 算法 可 以 选择 一 个 最 小 的 改动 序列 , 得 到 开销 最 低 的 全 局 性 纠正 方法 。 给 定 一 
个 不 正确 的 输入 x 和 文法 C, 这 些 算法 将 找 出 一 个 相关 串 y 的 语法 分 析 树 ,使 得 将 x 转换 为 y 所 
逢 要 的 插入 、 删 除 和 改变 的 词法 单元 的 数量 最 少 。 泪 憾 的 是 ， 从 时 间 和 空间 的 角度 看 , 实现 这 些 
方法 一 般 来 说 开销 太 大 , 因此 这 些 技术 当前 仅 具 有 理论 价值 。 

请 注意 , 一 个 最 接近 正确 的 程序 可 能 并 不 是 程序 员 想 要 的 程序 。 不 管 怎样 , 最 低 开销 纠正 的 
概念 仍然 提供 了 一 个 可 用 于 评价 错误 恢复 技术 的 指标 ， 并 已 经 用 于 为 短语 层次 的 恢复 寻找 最 佳 
PTR 


4.2 FRB 


2.2 六 中 已 经 介绍 了 文法 的 概念 。 在 那里 ， 它 用 于 系统 地 描述 程序 设计 语音 的 构造 (比如 表 

达 式 和 语句 ) 的 语法 。 下 面 的 产生 式 使 用 语法 变量 seme 来 表示 语句 ,使 用 变量 expr 表示 表达 式 。 

stmt—if (expr) stmt else stmt (4.4) 

EB AEE TSC BRIE SOHO AR ET ey Sa, SB Ae a a ae MT expr 是 什么 ,以 及 
stmt 可 以 是 什么 。 
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这 一 节 将 回顾 上 下 文 无 关 文法 的 定义 ， 并 介绍 下 在 讨论 语法 分 析 技术 时 要 用 到 的 一 些 术 语 。 
特别 地 , 推导 的 概念 在 讨论 产生 式 在 分 析 过 程 中 的 应 用 顺序 时 非常 有 用 。 
4.2.1 上 下文 无 天 文法 的 正式 定义 

根据 2.2 节 的 介绍 可 知 , 一 个 上 下 文 无 关 文法 (简称 文法 ) 由 终结 符号 、 非 终结 符号 、 一 个 开 
始 符号 和 一 组 产生 式 组 成 。 

1) 终结 符号 是 组 成 串 的 基本 符号 。 术 语 “ 词 法 单元 名 字 ” 是 “终结 符号 ”的 同义词 。 当 我 
们 讨论 的 显然 是 词法 单元 的 名 字 时 , 我 们 经 常 使 用 “词法 单元 ”这 个 词 来 指称 终结 符号 。 我 们 假 
设 终结 符号 是 词法 分 析 器 输出 的 词法 单元 的 第 一 个 分 量 。 在 (4.4) 中 , 终结 符号 是 关键 字 让 和 
else 以 及 符号 “( “和 “)”。 

2) 非 终结 符号 是 表示 帅 的 集合 的 语法 变量 。 在 (4.4) 中 ;stmt 和 expr 是 非 终 结 符号 。 非 终结 
符号 表示 的 串 集合 用 于 定义 由 文法 生成 的 语言 。 非 终结 符号 给 出 了 语言 的 层次 结构 , 而 这 种 层 
次 结构 是 语法 分 析 和 翻译 的 关键 。 

3) 在 一 个 文法 中 , 某 个 非 终 结 符号 被 指定 为 开始 符号 。 这 个 符号 表示 的 串 集 合 就 是 这 个 文 
法 生成 的 语言 。 按 照 惯例 , 首先 列 出 开始 符号 的 产生 式 。 

4) 一 个 文法 的 产生 式 描述 了 将 终结 符号 和 非 终 结 符号 组 合成 串 的 方法 。 每 个 产生 式 由 下 列 


元 素 组 成 : 
D 一 个 被 称 为 产生 式 头 或 堪 部 的 非 终 结 符号 。 这 个 产生 式 定义 了 这 个 头 所 代表 的 串 集合 的 
一 部 分 


@ 符号 -、。 有 时 也 使 用 : : = 来 替代 箭头 。 
@ 一 个 由 零 个 或 多 个 终结 符号 与 非 终结 符号 组 成 的 产生 式 体 或 大 部 ”产生 式 体 中 的 成 分 描 
述 了 产生 式 头 上 的 非 终结 符号 所 对 应 的 串 的 某 种 构造 方法 。 
U 42 中 的 文法 定义 了 简单 的 算术 表达 式 。 在 这 

















expression —> expression + term 
expression — expression - term 
WT) 
| SOE $ 终结 符号 是 expression — term 
id+-* / ()) term — term» factor 
n Į term — term / factor 
非 终结 符号 是 expression、term Fil factor, 而 expression 是 开始 符 termi lifactor 
号 。 口 factor => 《 expression ) 
factor 一 id 










4.2.2 符号 表示 的 约定 
为 了 避免 总 是 声明 “这 些 是 终结 符号 ”3;“ 这 些 是 非 终 42 简单 算术 表达 式 的 文法 
结 符号 ”, 等 等 , 在 本 书 的 其 余部 分 将 对 文法 符号 的 表示 使 用 以 下 约定 。 
1) 下 述 符号 是 终结 符号 : 
D 在 字母 表 里 排 在 前 面 的 小 写字 母 , Eia, bco 
@) 运算 符号 ji 比如 +、 天 等 
@ 标点 符号 , 比如 括号 、 逗 号 等 。 
DAFO i9, 
© REFE, 比如 id BR if, EREA BRR TAS, 
2) 下 述 符号 是 非 终 结 符号 : 
© 在 字母 表 中 排 在 前 面 的 大 写字 母 , EUA B, C 
@ 字母 5。 它 出 现时 通常 表示 开始 符号 。 
@ NG. 斜体 的 名 字 ， 比如 expr 或 seme, 
© 当 讨 论 程 序 设计 语言 的 构造 时 ， 大 写字 母 可 以 用 于 表示 代表 程序 构造 的 非 终 结 符号 。 比 
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如 , 表达 式 、 项 和 因子 的 非 终结 符号 通常 分 别 用 巨 、7 和 下 表示 。 
3) 在 字母 表 中 排 在 后 面 的 大 写字 母 (比如 庆 、Y、2) 表示 文 法 符号 。 也 就 是 说 ,表示 非 终结 
符号 或 终结 符号 。 
4) 在 字母 表 中 排 在 后 面 的 小 写字 母 ( 主要 是 w、v、…、z) 表示 (可 能 为 空 的 ) 终 结 符号 串 。 
5) 小 写 的 希腊 字母 , 比如 a、B、y, 表示 (可 能 为 空 的 ) 文法 符号 串 。 因此; 一 个 普通 的 产生 
式 可 以 写作 4-»a, 其 中 4 是 产生 式 的 头 ;a 是 产生 式 的 体 。 
6) 具有 相同 的 头 的 一 组 产生 式 Ae, , Asay, +, Avon, (AER) TAGME Aai ley | 
lalo RIE œi, az, ©, a PRE A 的 不 同 可 选 体 。 
7) 除非 特别 说 明 , 第 一 个 产生 式 的 头 就 是 开始 符号 。 
DEJ 按照 这 些 约定 ; 例子 4.5 的 文法 可 以 改 为 如 下 更 加 简单 的 形式 : 
E>E +TIE-TIT 
ToT + FIT/FIF 
F-+( E ) | id 
上 面 的 符号 表示 约定 告诉 我 们 已. 了 和 下 是 非 终结 符号 , 其 中 巨 是 开始 符号 。 其 余 的 符号 是 终结 
符号 。 
4,2.3 推导 
将 产生 式 看 作 重 写 规则 , 就 可 以 从 推导 的 角度 精确 地 描述 构造 语法 分 析 树 的 方法 。 从 开始 
符号 出 发 ,每 个 重 写 步 又 把 一 个 非 终结 符号 替换 为 它 的 某 个 产生 式 的 体 。 这 个 推导 思想 对 应 于 
自 顶 向 下 构造 语法 分 析 树 的 过 程 , 但 是 推导 概念 所 给 出 的 精确 性 在 讨论 自 底 向 上 的 语法 分 析 过 
程 时 尤其 有 用 。 正 如 我 们 将 看 到 的 ， 自 底 向 上 语法 分 析 和 一 种 被 称 为 “最 右 ” 推 导 的 推导 类 型 相 
关 。 在 这 种 推导 过 程 中 , 每 一 步 重 写 的 都 是 最 右边 的 非 终结 符号 。 
比如 , 考虑 下 列 只 有 一 个 非 终结 符号 巨 的 文法 。 它 在 文法 (4.3) 中 增加 了 一 个 产生 
SE -E; 


E 


E>-E + EIE» E| -E1 (CE) | id (4.7) 
产生 式 E— -下 表明 ;如 果 五 表示 一 个 表达 式 ， 那 么 二 也 必然 也 表示 二 处 表 适 趟 凡 将 二 个 五 替换 
为 -五 的 过 程 写作 
E=-E 
上 式 读 作 “推导 出 -Eg”。 产 生 式 E(B ) aT LORE A SCRE AES Eih HRR E RE Aap SC | EH 
ACE). KA, E + F>(E) * ERE x ESE * (E), 我们 可 以 按照 任意 顺序 对 单个 五 未 
断 地 应 用 各 个 产生 式 , 得 到 一 个 替换 的 序列 。 比 如 : 

Es -Es -( E)=>-(id ) 
我 们 将 这 个 蔡 换 序列 称 为 从 E 到 - (id ) 的 推导 。 这 个 推导 证 明了 串 -( id ) 是 表达 式 的 一 
个 实例 。 

要 给 出 推导 的 一 般 性 定义 , 考虑 一 个 文法 符号 序列 中 间 的 非 终 结 符号 4， 比 如 a4B, 其 中 a 
Me 是 任意 的 文法 符号 串 。 BR Ay 是 一 个 产生 式 。 那么 我 们 写作 .m4B 坊 ayB。 HBS 
“通过 一 步 推导 出 ”。 当 一 个 推导 序列 0 0-0, 将 al BRA a, 我 们 说 &i 推导 出 es 
RNA “ALSENA LES IH” RTT WEA ES RRA, 因此 ， 

1) 对 于 任何 串 a, a 5a, 并 且 

2) WF a 58 且 B=y， WA a 5y- 

RM SM “AERLE ERR” , 
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如 果 Sda, 其 中 S 是 文法 C 的 开始 符号 , 我 们 说 a 是 C 的 一 个 句 型 (sentential form) 。 请 注 
意 , 一个 句 型 可 能 既 包含 终结 符号 又 包含 非 终 结 符号 ， 也 可 能 是 空 串 。 文 法 C 的 一 个 句子 (sen- 
tence) 是 不 包含 非 终结 符号 的 句 型 。 二 个 文法 生成 的 语言 是 它 的 所 有 句子 的 集合 。 因 此 , 一 个 终 
结 符号 串 w 在 C 生成 的 语言 L(GC) 中 ， 当 且 仅 当 w 是 6 的 一 个 句子 (或 者 说 5 Sw). 可 以 由 文法 
生成 的 语言 被 称 为 上 下 文 无 关 语 言 (context-free language) o 如 果 两 个 文法 生成 相同 语言 , 这 两 个 


文法 就 被 称 为 是 等 价 的 。 
m- (id+id) 是 文法 (4.7) 的 一 个 句子 , 因为 存在 一 个 推导 过 程 
让 Cid (4.8) 


HE. EB. -(B) oo. - (id rid) HERLEI, RAES- (id +id ) 来 指明 
- (id + id ) 可 以 从 五 推导 得 到 。 

在 每 二 个 推导 步 又 上 都 需要 做 两 个 选择 。 我 们 要 选择 替换 哪个 非 终结 符号 , 并 且 在 做 出 这 
个 类 定之 后 ， 还 必须 选择 二 个 以 此 非 终结 符号 作为 头 的 产生 式 。 比如 , 下 面 给 出 的 =(ida + id ) 
的 另 一 种 推导 和 推导 (4. 8 ) 在 最 后 两 步 有 所 不 同 : 

Ps- Pa- (EYSH EFEN E id J id iid) (4.9) 

在 这 两 个 推导 中 ) 每 个 非 终结 符号 都 被 蔡 换 为 同一 个 产生 式 体 ， 但 替换 的 顺序 有 所 不 同 。 

为 了 理解 语法 分 析 器 是 如 何 工作 的 ， 我 们 将 考虑 在 每 个 推导 步骤 中 按照 如 下 方式 选择 被 替 
换 的 非 终 结 符号 的 两 种 推导 过 程 : 

1) 在 最 左 推导 (leftmost derivation) 中 ,总 是 选择 每 个 名 型 的 最 左 非 终结 符 号 。 如 果 a=3B 是 一 
个 推导 步骤 , 且 被 替换 的 是 a 中 的 最 左 非 终结 符号 , 我 们 写作 “ Bo 

2) 在 最 右 推导 (rightmost derivation) 中 ,总 是 选择 最 右边 的 非 终结 符号 ， 此 时 我 们 写作 a >. 
推导 (4. 8) 是 最 左 推导 , 因此 它 可 以 写成 

fa ES CE ye (E+Elg- OW ee es (+ 

请 注意 ,推导 (4. 9) 是 一 个 最 右 推导 。 

根据 我 们 的 符号 表示 惯例 , 每 个 最 左 推导 步 又 都 可 以 写成 wAy =>wôy, Ep w 只 包含 终结 符 
号 , As 是 被 应 用 的 产生 式 , 而 7y 是 一 个 文法 符号 串 。 为 了 强调 a 经 过 一 个 最 左 推导 过 程 得 到 
B, 我 们 写作 a >p- 如 果 5 >a , 那么 我 们 说 a 是 当前 文法 的 最 左 句 型 (left-sentential form) 。 

对 于 最 右 推导 也 有 类 似 的 定义 ; 最 右 推导 有 时 也 称 为 规范 推导 (canonical derivation) 。 
4.2.4 语法 分 析 树 和 推导 

语法 分 析 树 是 推导 的 图 形 表示 形式 , 它 过 滤 掉 了 推导 过 程 中 对 非 终结 符号 应 用 产生 式 的 顺 
序 。 语 法 分 析 树 的 每 个 内 部 结 点 表示 一 个 产生 式 的 应 用 。 该 内 部 结 点 的 标号 是 此 产生 式 头 中 的 
非 终 结 符号 4; 这 个 结 点 的 子 结 点 的 标号 从 左 到 右 组 成 了 在 推导 过 程 中 替换 这 个 4 的 产生 式 体 。 


比如 , 图 4-3 中 , - (Cid + id ) 的 语法 分 析 树 是 根据 推导 (4. 8) 得 到 E 
的 , 它 也 可 以 根据 推导 (4.9) 得 到 。 

一 标语 法 分 析 树 的 叶子 结 点 的 标号 既 可 以 是 非 终结 符号 , 也 可 以 是 ae a 
终结 符号 。 从 左 到 右 排列 这 些 符号 就 可 以 得 到 一 个 句 型 ， 它 称 为 这 棵 树 Paik 
的 结果 (yield ) 或 边缘 ( frontier ) 。 | = i 

为 了 了 解 推 导 和 语法 分 析 树 之 间 的 关系 ,考虑 任意 的 推导 wm 30, id id 


=a, EP ai 是 单个 非 终 结 符号 4。 对 于 推导 中 的 每 个 句 型 ui, 我 图 43 - (id +id) Ay 
们 可 以 构造 出 一 个 结果 为 ai 的 语法 分 析 树 。 这 个 构造 过 程 是 对 i 的 一 次 语法 分 析 树 


Re 
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归纳 过 程 。 

基础 : a1 =A 的 语法 分 析 树 就 是 标号 为 4 的 单个 结 点 。 

归纳 步骤 : 假设 我 们 已 经 构造 出 了 一 棵 结果 为 ui.1 =X1X2…Xi 的 语法 分 析 树 (请 注意 , 按 昭 
我 们 的 符号 表示 约定 ， 每 个 文法 符号 X, 可 以 是 非 终结 符号 , 也 可 以 是 终结 符号 )。 假 设 ai 是 将 
w 1 中 的 某 个 非 终结 符号 BEBO B= Yous Yn 而 得 到 的 句 型 。 也 就 是 说 ,在 这 个 推导 的 第 i 
步 中 ， 对 aj_1 应 用 规则 XB, 推导 出 a; =X Xq°7-X;_1BXj41° Xho 

为 了 模拟 这 一 推导 步骤 ; 我 们 在 当前 的 语法 分 析 树 中 找 出 左 起 第 j 个 非 e 叶子 结 点 。 这 个 结 
点 的 标号 为 Xs 向 这 个 叶子 结 点 添加 m 个 子 结 点 , 从 左边 开始 分 别 将 这 些 子 结 点 标号 为 Y、Y、 
.…、Y,,。 作 为 一 种 特殊 情况 ,如 果 m =0, 那么 B=e, 我 们 给 第 j 个 叶子 结 点 加 上 一 个 标号 为 的 
子 结 点 。 
GA GES (4. 8) 构造 得 到 的 语法 分 析 树 的 序列 显示 在 图 4- 4 中 。 推 导 的 第 一 步 是 
E- -已 。 为 了 模拟 这 一 步 , 我 们 将 标号 分 别 为 -各 的 两 个 子 结 点 加 到 第 一 棵 树 的 根 结 点 石上 ， 
得 到 第 二 棵 语法 分 析 树 。 

这 个 推导 的 第 二 步 是 -ES -;( E )。 相 应 地 , 将 标号 分 别 为 (、E、) 的 三 个 子 结 点 加 到 第 二 
棵 树 中 标号 为 瑟 的 叶子 结 点 上 , 得 到 结果 为 -( E ) 的 第 三 棵 树 。 按 照 这 个 方法 继续 下 去 , RN 
就 得 到 了 完整 的 语法 分 析 树 ， 即 第 六 棵 树 。 口 

因为 语法 分 析 树 忽略 了 替换 句 型 中 符号 的 不 同 顺序 , 所 以 在 推导 和 语法 分 析 树 之 间 具 有 多 
对 二 的 关系 。 比 如 , 推导 (4.8) 和 (4.9) 都 和 图 4-4 中 的 最 后 一 棵 语法 分 析 树 关联 。 

E = E = E 
PA Siar 
一 E 一 E 
AR 
CEAN 


E => E => E 
aa 人 Aaya 
PISA AES fala 
een) By te) (ff iw) 
KAN Aas aL 
E + E a E apa: 


id id id 


图 4-4 HES (4. 8) 的 语法 分 析 树 序列 


因为 在 语法 分 析 树 和 最 左 推导 /最 右 推导 之 间 存在 一 对 一 的 关系 ,所 以 在 接 下 来 的 内 容 中 ， 
我 们 将 频繁 地 通过 构造 最 左 推导 或 最 右 推导 来 进行 语法 分 析 。 最 左 或 最 右 推导 都 以 一 种 特定 的 
顺序 来 替换 句 型 中 的 符号 , 因此 它们 也 过 滤 掉 了 顺序 上 的 不 同 。 不 难说 明 ,每 一 棵 语法 分 析 树 都 
和 唯一 的 最 左 推导 及 唯一 的 最 右 推导 相关 联 。 
4.2.5 MIE 

根据 2. 2.4 节 的 介绍 可 知 , 如果 一 个 文法 可 以 为 某 个 句子 生成 多 棵 语法 分 析 树 , 那么 它 就 是 
二 义 性 的 (ambiguous) 。 换 句 话说 , 二 义 性 文法 就 是 对 同一 个 句子 有 多 个 最 左 推导 或 多 个 最 右 扒 
导 的 文法 。 
C 算术 表达 式 文法 (4.3) 允 许 句 子 id + id * id 具有 两 个 最 左 推导 : 
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Be ss) EWE BSE ee 
=> id +E => E+E * E 
= id +. suk => id+E*« E 
=> id + id *« E => id + id * E 
= id + id * id = id + id * id 
相应 的 语法 分 析 树 如 图 4- 所 示 。 t3 mT L- IN 
请 注意 ;图 4-$a 中 的 语法 分 析 树 反映 了 通常 的 + wo + OB Batis E 


Me 之 间 的 优先 级 关系 ,而 图 4-5b bins LOI gg dl 
没有 反映 出 这 一 点 。 也 就 是 说 , 按照 惯例 ,应 该 将 运算 | kee. a | 


符 * 当 作 优先 级 高 于 + 的 运算 符 来 处 理 , 相应 地 , R ol) eR 南下 
们 通常 将 a + 5 * c 这 样 的 表达 式 按照 & + (b x* c), eh eis . 
而 不 是 (a +b) * c 的 方式 进行 求 值 。 A E; 


大 部 分 语法 分 析 器 都 期 望 文法 是 无 二 义 性 的 , 否则 , 我 们 就 不 能 为 一 个 句子 唯一 地 选 定语 法 分 
析 树 。 在 某 些 情 况 下 , 使 用 经 过 精心 选择 的 二 义 性 文法 也 可 以 带 来 方便 。 但 同时 需要 使 用 消 二 义 性 
规则 ( disambiguating rule) 来 “抛弃 ”不 想 要 的 语法 分 析 树 ,只 为 每 个 句子 留 下 一 棵 语法 分 析 树 。 
4.2.6 验证 文法 生成 的 语言 

推断 出 一 个 给 定 的 产生 式 集 合生 成 了 某 种 特定 的 语言 是 很 有 用 的 , 尽管 编译 器 的 设计 者 很 少 会 
对 整个 程序 设计 语言 文法 做 这 样 的 事情 。 当 研究 一 个 为 手 的 构造 时 , 我 们 可 以 写 出 该 构造 的 一 个 简 
洁 、 抽象 的 文法 , 并 研究 该 文法 生成 的 语言 。 我 们 将 为 下 面 的 条 件 语句 构造 出 这 样 的 文法 。 

证 明文 法 6G 生成 语言 L 的 过 程 可 以 分 成 两 个 部 分 : 证 明 G 生 成 的 每 个 串 都 在 中 , 并 且 反 向 
证 明 工 中 的 每 个 串 都 确实 能 由 G 生成 。 
考虑 下 面 的 文法 : 

Sry S e (4. 13) 

初 看 可 能 不 是 很 明显 , 但 这 个 简单 的 文法 确实 生成 了 所 有 具有 对 称 括号 对 的 串 , 并且 只 生成 这 样 
的 串 。 为 了 说 明 原因 , 我 们 将 首先 说 明 从 5 推导 得 到 的 每 个 句子 都 是 括号 对 称 的 , 然后 说 明 每 个 
括号 对 称 的 串 都 可 以 从 S 推导 得 到 。 为 了 证 明 从 5 推导 出 的 每 个 句子 都 是 括号 对 称 的 , 我 们 对 推 
导 步 数 n 进行 归纳 。 

基础 : 基础 是 n=1。 唯 一 可 以 从 5 经 过 一 步 推 导 得 到 的 终结 符号 串 是 空 串 , 它 当 然 是 括号 对 
称 的 。 

归纳 步骤 : 现在 假设 所 有 步 数 少 于 的 推导 都 得 到 括号 对 称 的 句子 , 并 考虑 一 个 恰巧 有 nn 步 
的 最 左 推导 。 这 样 的 推导 必然 具有 如 下 形式 : 

S =(5S)S => («)S >(x)y 

WS R) x Aly 的 推导 过 程 都 少 于 nn 步 ， 因此 根据 归纳 假设 ,% Ay 都 是 括号 对 称 的 。 因 此 ,上 串 
Cx) 7 必然 是 括号 对 称 的 。 也 就 是 说 , ERA 相同 数量 的 左 括号 和 右 括号 ， 并 且 它 的 每 个 前 缀 中 
的 左 括号 不 少 于 右 括 号 。 
,现在 已 经 证 明了 可 以 从 $ 推 导出 的 任何 串 都 是 括号 对 称 的 , 接 下 来 我 们 必须 证 明 每 个 括号 
对 称 的 串 都 可 以 从 S 推导 得 到 。 为 了 证 明 这 一 点 , 我 们 对 串 的 长 度 进行 归纳 。 

基础 : 如 果 串 的 长 度 是 0, 它 必 然 是 se。 这 个 串 是 括号 对 称 的 ,上 且 可 以 从 8 推导 得 到 。 

归纳 步骤 ; 首先 请 注意 ,每 个 括号 对 称 的 串 的 长 度 是 偶数 。 假 设 每 个 长 度 小 于 和 2 的 括号 对 称 
的 串 都 能 够 从 S 推导 得 到 , 并 考虑 一 个 长 度 为 2"(m 三 1) 的 括号 对 称 的 串 w。 刀 一 定 以 堪 括号 开 
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头 。 邻 (x) 是 w 的 最 短 的 、 左 括号 个 数 和 有 括号 个 数 相同 的 非 空 前 级 ,那么 w AER w = (x) y 
的 形式 , 其 中 x 和 vy 都 是 括号 对 称 的 。 A x M y 的 长 度 都 小 于 2n, 根据 归纳 假设 , 它们 可 以 从 
S 推导 得 到 。 因 此 , 我 们 可 以 找到 一 个 如 下 形式 的 推导 : 
S=3(S)S 3(«)S S(«)y 
它 证 明 w = (x) y¥ 也 可 以 从 8 推导 得 到 。 O 
4.2.7 ”上 下 文 无 关 文法 和 正则 表达 式 
在 结束 关于 文法 及 其 性 质 的 讨论 之 前 ,我们 要 说 明文 法 是 比 正则 表达 式 表达 能 力 更 强 的 表 
示 方 法 。 每 个 可 以 使 用 正则 表达 式 描 述 的 构造 都 可 以 使 用 文法 来 描述 , 但 是 反之 不 成 立 。 换 句 
话说 ,每 个 正则 语言 都 是 一 个 上 下 文 无 关 语言 , 但 是 反之 不 成 立 。 
比如 , 正则 表达 式 (alb) * abb 和 文法 
40 一 a40o1 bAol aA, 
A,—>bA, 
A,—>bA, 
A3,—€ 
描述 了 同一 个 语言 , 即 以 abb 结尾 的 由 a 和 4 组 成 的 串 的 集合 。 
我 们 可 以 机 械 地 构造 出 和 一 个 不 确定 有 穷 自动 机 ( NFA ) 识 别 同样 语言 的 文法 。 上 面 的 文法 
是 使 用 下 面 的 构造 方法 , 根据 图 3-24 中 的 NPA 构造 得 到 的 。 
1) 对 于 NFA 的 每 个 状态 i, 创建 一 个 非 终结 符号 4;。 
2) 如 果 状 态 i 有 一 个 在 输入 a 上 到 达 状 态 j 的 转换 , 则 加 入 产生 式 4 一 a4j。 如 果 状 态 ; 在 输 
Ace 上 到 达 状 态 j, 则 加 入 产生 式 4;->4j。 
3) MÈ i 是 一 个 接受 状态 , 则 加 入 产生 式 4 一 e。 
4) WR i 是 自动 机 的 开始 状态 , 令 4; 为 所 得 文法 的 开始 符号 。 : 
另 一 方面 , 语言 L= {ab n 宇 1|( 即 由 同样 数量 的 a 和。 组 成 的 串 的 集合 ) 是 一 个 可 以 用 文 
法 描述 但 不 能 用 正则 表达 式 描述 的 语言 的 原型 例子 。 下 面 用 反 证 法 来 说 明 这 一 点 。 假 设 L 是 用 
某 个 正则 表达 式 定义 的 语言 。 我 们 可 以 构造 一 个 具有 有 穷 多 个 状态 ( 比如 说 天 个 状态 ) 的 DFA D 
来 接受 L。 因 为 D 只 有 % 个 状态 , 对 于 一 个 以 多 于 k 个 a 开头 的 输入 , D 一 定 会 进入 某 个 状态 两 
次 , 假设 这 个 状态 是 ;;, 如 图 4-6 所 示 。 假 设 从 s; 返回 到 其 自身 的 路 径 的 标号 序列 是 ao“。 因 为 


a'b 在 这 个 语言 中 , 因此 必然 存在 一 条 bi yal" HOB 5 

标号 为 天 从 s; 到 某 个 接受 状态 f 的 路 i 

Bo 但 是 ,一 定 还 存在 一 条 从 开始 状态 标号 为 ai 的 路 径 FEY b HIRIZ 

so 出 发 , 经 过 s; 最 后 到 达 / 的 路 径 , 它 z e budan z 
的 标号 序列 为 ab’, 如 图 4-6 所 示 。 因 图 4-6 F a'b 和 ab' fy DFA D 


此 ,D 也 接受 aibi, 但 db 这 个 串 不 在 语 
言 工 中 , 这 和 荆 是 刀 所 接受 的 语言 这 个 假设 矛盾 。 

我 们 通俗 地 说 “有 穷 自动 机 不 能 计数 ”, 这 意味 着 有 穷 自动 机 不 能 接受 像 |a”"b"In 三 1| 这 样 
的 语言 , 因为 它 不 能 记录 下 在 它 看 到 第 一 个 5b 之 前 读 人 的 a 的 个 数 。 类 似 地 ， “一 个 文法 可 以 对 两 
个 个 体 进行 计数 , 但 是 无 法 对 三 个 个 体 计数 ”, 我 们 在 4. 3.5 节 中 考虑 非 上 下 文 无 关 的 语言 构造 
时 将 介绍 这 一 点 。 
4.2.8 4.2 节 的 练习 

练习 4. 2. 1: 考虑 上 下 文 无 关 文法 : 
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SSS, +. 18S *-la 
WRB aata* 4 
1) 给 出 这 个 串 的 一 个 最 左 推导 。 
2) 给 出 这 个 串 的 一 个 最 右 推导 。 
3) 给 出 这 个 串 的 一 棵 语法 分 析 树 。 
! 4) 这 个 文法 是 否 为 二 义 性 的 ? 证 明 你 的 回答 。 
! 5) 描述 这 个 文法 生成 的 语言 。 
练习 4. 2. 2: 对 下 列 的 每 一 对 文法 和 串 重 复 练习 4 2 ly 
1) S—0,S5 1 101 #000111, 
2) S>+ SS1* SS |\-a Fil + * aaa, 
13) SoS(S)S) € MB(()()). 
! 4) SoS.+ $1 SS 10S) 0) Se lia ME (Cata) ka 
15) S> ( L) | a WR Lol, SAS MH (a, a), a; (a)), 
1! 6) S~a SbS | bSas | e fE aabbab, 
! 7) 下 面 的 布尔 表达 式 对 应 的 文法 : 
bexpr—-bexpr or bterm | bterm 
bterm—>bterm and bfactor | bfactor 
bfactor—not bfactor | ( pexpr ) | true | false 
练习 4.2.3; 为 下 面 的 语言 设计 文法 : 
1) 所 有 由 0 和 1 组 成 的 并 且 每 个 0 之 后 都 至 少 跟着 一 个 1 的 捉 的 集合 。 
! 2) 所 有 由 0 和 1 组 成 的 回 文 (palindrome) 的 集合 , 也 就 是 从 前 面 和 从 后 面 读 结果 都 相同 的 
串 的 集合 
1-3) 所 有 由 0 和 工 组 成 的 具有 站 同 多 个 0 和 1 的 串 的 集合 
11 4) 所 有 由 0 和 1 组 成 的 并 且 0 的 个 数 和 1 的 个 数 不 同 的 串 的 集合 。 
! 5) 所 有 由 0 和 1 组 成 的 且 其 中 不 包含 子 串 011 的 串 的 集合 。 
!! 6) 所 有 由 0 和 1 组 成 的 形 如 xy 的 串 的 集合 , 其 中 xzy Ha 和 7 等 长 。 
1 练习 4;2.4: 有 一个 常用 的 扩展 的 文法 表示 方法 。 ny 产生 式 体 中 的 方 括 
号 和 花 括 号 是 元 符号 (如 一 或 1 ), 且 具有 如 下 含义 : 
1) 一 个 或 多 个 文法 符号 两 边 的 方 括号 表示 这 些 构造 是 可 选 的 a 因此, 产生 式 4-5X[Y]Z 和 
两 个 产生 式 4 一 XYZ 及 4->XZ 具有 相同 的 效果 。 
2) 下 或 多 个 文法 符号 两 边 的 花 括 号 表示 这 些 符号 可 以 重复 任意 多 次 (包括 零 次 )。 因此 ， 
AX {YZ MU FERR ERFIR AHHAR: AX, AKYZ, A>XYZYZ, :等 等 4 
证 明 这 两 个 扩展 并 没有 增加 文法 的 功能 。 也 就 是 说 ,由 带 有 这 些 扩展 表示 的 文法 生成 的 任何 语 
言 都 可 以 由 一 个 不 带 扩 展 表 示 的 文法 生成 4 
练习 4. 2. 5: 使 用 练习 4 2 4 中 描述 的 括号 表示 法 来 简化 如 下 的 关于 语句 块 和 条 件 语句 的 六 
stmt — > if expr then stmt else stmt 
|. if stmt then stmt 
| -begin stmtList end 
stmtList—> stmt; stmtList | stmt 
l 练习 4.2.6: 扩 展 练习 412.4 的 思想 , 使 得 产生 式 体 中 可 以 出 现 文法 符号 的 任意 正则 表达 
式 。 证 明 这 个 扩展 并 没有 使 得 文法 可 以 定义 任何 新 的 语言 。 
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| 练习 4. 2.7: 如 果 不 存 在 形 如 5 SwXy Sway 的 推导 , 那么 文法 符号 (终结 符号 或 非 终 结 
符号 ) 就 被 称 为 无 用 的 (useless)。 也 就 是 说 , 不 可 能 出 现在 任何 句子 的 推导 过 程 中 。 

1) 给 出 一 个 算法 , 从 一 个 文法 中 消除 所 有 包含 无 用 符号 的 产生 式 。 

2) 将 你 的 算法 应 用 于 以 下 文法 : 





5 一 014 stmt declare id optionList 
A—AB optionList optionList option | € 
option mode | scale | precision | base 
Bl mode real | complex 
练习 4. 2.8: 图 4.7 中 的 文法 可 生成 单个 数值 “| seale fixed | floating 
Sk 3 oe, = precision single | double 
标识 符 的 声明 , 这 些 声明 包含 四 种 不 同 的 、 相 互 独 base binary | decimal 
立 的 数字 性 质 。 
1) 扩展 图 4-7 中 的 文法 , 使 得 它 可 以 允许 n 图 4 全 多 属性 声明 的 文法 


种 选项 4;, 其 中 是 一 个 固定 的 数 , Y=1，2,…,n。 选 项 4; 的 取 值 可 以 是 a; R bjo 你 的 文法 只 
能 使 用 0(n) 个 文法 符号 , 并 且 产 生 式 的 总 长 度 也 必须 是 0(n) 的 。 

! 2) 图 4-7 中 的 文法 和 它 在 1 中 的 扩展 支持 互相 矛盾 或 宛 余 的 声明 ,比如 : 

declare foo real fixed real floating 

我 们 可 以 要 求 这 个 语言 的 语法 禁止 这 种 声明 。 也 就 是 说 ; 由 这 个 文法 生成 的 每 个 声明 中 ,nn 
种 选项 中 的 每 一 项 都 有 且 只 有 一 个 取 值 。 如 果 我 们 这 样 做 ; 那么 对 于 任意 给 定 的 n 值 , 合法 声明 
的 个 数 是 有 穷 的 。 因 此 和 任何 有 穷 语言 一 样 , 合法 声明 组 成 的 语言 有 一 个 文法 (同时 也 有 一 个 正 
则 表达 式 ) 。 最 显而易见 的 文法 是 这 样 的 : 文法 的 开始 符号 对 每 个 合法 声明 都 有 一 个 产生 起， 这 
ERA n! 个 产生 式 。 该 文法 的 产生 式 的 总 长 度 是 0(n xn1)。 你 必须 做 得 更 好 : 给 出 一 个 产生 
式 总 长 度 为 0(n2") 的 文法 。 

!! 3) 说 明 对 于 任何 满足 2 中 的 要 求 的 文法 , 其 产生 式 的 总 长 度 至 少 是 2"。 

2 ES E E eee 无 矛盾 5 对 于 这 个 方 
法 的 可 行 性 , 本 题 3 的 结论 说 明了 什么 问题 ? 


4.3 设计 文法 


文法 能 够 描述 程序 设计 语言 的 大 部 分 (但 不 是 全 部 ) 语法。 比如 , 在 程序 中 标识 符 必 须 先 声 
明 后 使 用 , 但 是 这 个 要 求 不 能 通过 一 个 上 下 文 无 关 文 法 来 措 述 。 因 此 ,一 个 语法 分 析 器 接受 的 词 
法 单元 序列 构成 了 程序 设计 语言 的 超 集 ; 编译 器 的 后 续 步 又 必须 对 语法 分 析 器 的 输出 进行 分 析 ， 
以 保证 源 程序 遵守 那些 没有 被 语法 分 析 器 检查 的 规则 。 

本 节 将 先 讨论 如 何在 词法 分 析 器 和 语法 分 析 器 之 间 分 配 工作 。 然 后 考虑 几 个 用 来 使 文法 更 
适 于 语法 分 析 的 转换 方法 。, 其 中 的 一 个 技术 可 以 消除 文法 中 的 二 义 性 ; 而 其 他 的 技术 ~ 一 消除 
左 递 归 和 提取 左 公 因子 一 一 可 用 于 改写 文法 , 使 得 这 些 文法 适用 于 自 顶 向 下 的 语法 分 析 。 我们 
在 本 节 的 最 后 将 考虑 一 些 不 能 使 用 任何 文法 描述 的 程序 设计 语言 构造 。 
4. 3.1 词法 分 析 和 语法 分 析 

如 我 们 在 4.2.7 节 看 到 的 , 任何 能 够 使 用 正则 表达 式 描述 的 东西 都 可 以 使 用 文法 描述 。 因 此 
我 们 自然 会 问 :“ 为 什么 使 用 正则 表达 式 来 定义 一 个 语言 的 词法 语法 ?”, 理由 有 多 个 。 

1) 将 一 个 语言 的 i 看 法 结构 分 为 词法 和 非 词法 两 部 分 可 以 很 方便 地 将 编译 器 前 端 模块 化 ， 将 
前 端 分 解 为 两 个 大 小 适中 的 组 件 。 

2) 一 个 语言 的 词法 规则 通常 很 简单 ,我们 不 需要 使 用 像 文 法 这 样 的 功能 强大 的 表示 方法 来 
描述 这 些 规则 。 
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3) 和 文法 相 比 ,正则 表达 式 通 常 提供 了 更 加 简洁 且 易 于 理解 的 表示 词法 单元 的 方法 

4) 根据 正则 表达 式 自动 构造 得 到 的 词法 分 析 器 的 效率 要 高 于 根据 任意 文法 自动 构造 得 到 的 
分 析 器 。 

并 不 存在 一 个 严格 的 指导 方针 来 规定 哪些 东西 应 该 放 到 ( 和 语法 规则 相对 的 ) 词 法 规则 中 。 
正则 表达 式 最 适合 描述 诸如 标识 符 、 常 量 、 关 键 字 、 空 白 这 样 的 语言 构造 的 结构 。 另 一 方面 , x 
法 最 适合 描述 筑 套 结构 ， 比 如 对 称 的 括号 对 ,匹配 的 begin-end, 相互 对 应 的 if-then-else 等 。 这 些 
艇 套 结构 不 能 使 用 正则 表达 式 描述 8 
4.3.2 消除 二 义 性 

有 时 ,一 个 二 义 性 文法 可 以 被 改写 为 无 二 义 性 的 文法 ”例如 , 我 们 将 消除 下 面 的 “悬空 -elsey 
文法 中 的 二 义 性 : 

stmt — if expr then stmt 
| if expr then stmt else stmt (4. 14) 
| other 

这 里 “other” 表 示 任 何其 他 语句 。 根 据 这 个 文法 , 下 面 的 复合 条 件 语句 

if E, then S, else if £, then S, else S, 
的 语法 分 析 树 如 图 4- 8 RO. SCE (4. 14) 是 二 义 性 的 ， 因 为 串 
if E, then if £, then S, else S, (4. 15) 
具有 图 4-9 所 示 的 两 棵 语法 分 析 树 。 


stmt, 


M a AS 


if etpr then stmt else ~ stmt 


o 


if ezpr then stmt else — stmt 


六 > aes 





Sz ca 
图 4-8 一 个 条 件 语 句 的 语法 分 析 树 
oa eas 
a ao 
it gopr then AS w m Sa ee A 
ae yA os stmt else _~ stmt erie 和 a 
SFN ADN AEN Zay 
Ez Si 5; Ez Sı 


图 4-9 一 个 二 义 性 句子 的 两 颗 语 法 分 析 树 
在 所 有 包含 这 种 形式 的 条 件 语句 的 程序 设计 语言 中 ,总 是 会 选择 第 一 樟 语 法 分 析 树 。 通 用 
的 规则 是 “每 个 else 和 最 近 的 尚未 匹配 的 then 匹配 ”9 从 理论 上 讲 , 这 个 消除 二 义 性 规则 可 以 
用 一 个 文法 直接 表示 , 但 是 在 实践 中 很 少 用 产生 式 来 表示 该 规则 。 
EA RATI URZ -else 文法 (4. 14) 改写 成 如 下 的 无 二 义 性 文法 。 基 本 思想 是 在 一 个 
then 和 一 个 else 之 间 出 现 的 语句 必须 是 “已 匹配 的 "。 也 就 是 说 , 中间 的 语句 不 能 以 一 个 尚未 匹 





© EMS 的 下 标 仅 用 于 区 分 同一 个 非 终结 符号 的 不 同 出 现 ,并 不 表示 不 同 的 非 终 结 符号 。 
O 我 们 应 该 注意 到 ,C 语言 和 它 的 派生 语言 也 属于 这 一 类 语言 。 虽然 C 系列 的 语言 不 使 用 关键 字 then, {E then 的 作 
用 是 由 证 之 后 的 条 件 表达 式 的 括号 对 来 承担 的 。 
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配 的 (或 者 说 开放 的 》then 绪 尾 。 一 个 已 匹配 的 语句 要 么 是 一 个 不 包含 开放 语句 的 让- then-else 语 
Ai}, 要 么 是 一 个 非 条 件 语句 4 因此 我 们 可 以 使 用 图 4-10 中 的 文法 。 这 个 文法 和 悬空 else 文法 
(4.14) 生 成 同样 的 串 集合 , 但 是 它 只 允许 对 串 (4. 15 ) 进行 一 种 语法 分 析 , 也 就 是 将 每 个 else 和 
前 面 最 近 的 尚未 匹配 的 then 匹配 。 O 


-> .matched_stmt 

| open.stmt 

inatched_stmt — if expr then matched_stmt else matched_stmt 
| 
一 2 
| 


stmt 


other 
if expr then stmt 
if expr then matched_stmt else open_stmt 


open.stmt 





Æl 4-10 if-then-else 语句 的 无 二 义 性 方法 


4.3.3 左 递 归 的 消除 
如 果 一 个 文法 中 有 一 个 非 终 结 符号 4 使 得 对 某 个 串 a 存在 一 个 推导 4 = Aa, 那么 这 个 文法 
就 是 左 弟 归 的 (left recursive) 。 自 顶 向 下 语法 分 析 方法 不 能 处 理 左 递归 的 文法 ， 因 此 需要 一 个 转 
换 方法 来 消除 左 递归 。 在 2.4.5 节 中 , 我 们 讨论 了 立即 左 递归 , MEERA AA 的 产生 式 的 情 
况 。 这 里 我 们 研究 一 般 性 的 情形 。 在 2.4.5 节 中 , 我 们 说 明了 如 何 把 左 递归 的 产生 式 对 4 一 
Aa | B 蔡 换 为 非 左 递归 的 产生 式 : 
A 一 B4 
A'—aA' le 
这 样 的 替换 不 会 改变 可 从 4 推导 得 到 的 串 的 集合 。 这 个 规则 本 身 已 经 足以 用 来 处 理 很 多 文法 。 
这 里 重复 一 下 非 左 递归 的 表达 式 文法 (4 2) : 
E =%-1E' 
El ot) T Ele 
T 一 FT+ 
T — +FT'le 
FO a, CBO Ie 
它 是 通过 消除 表达 式 文法 (4.1) 中 的 立即 左 递归 而 得 到 的 。 左 递归 的 产生 式 对 E> +T 1 了 被 蔡 换 
HE>T E'M E’ + TE' | e 类 似 地 ,了 和 也 的 新 产生 式 也 是 通过 消除 立即 左 递归 而 得 到 的 。 O 
立即 左 递归 可 以 使 用 下 面 的 技术 消除 ， 该 技术 可 以 处 理 任意 数量 的 4 产生 式 。 首 先 将 4 的 
全 部 产生 式 分 组 如 下 : 
A-+Aa,| Aa, | ++: | Aa, |! Bil Bl |B, 
其 中 B; 都 不 以 4 开头 。 然 后 , 将 这 些 4 产生 式 蔡 换 为 : 
和 
A’a,A' | aA’ 1… l anA lE 
非 终结 符号 4 生成 的 串 和 替换 之 前 生成 的 串 一 样 , 但 不 再 是 左 递 归 的 。 这 个 过 程 消除 了 所 
有 和 4 和 4' 的 产生 式 相关 的 左 递归 (前 提 是 a; 都 不 是 e), 但 是 它 没 有 消除 那些 因为 两 步 或 多 步 
推导 而 产生 的 左 递归 。 比 如 ,考虑 文法 
S 一 4a lb 
4 一 4c1Sde (4. 18) 
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因为 5 坊 44 志 Sda, 所 以 非 终结 符号 5 是 左 递归 的 二 但 它 不 是 立即 左 递 归 的 。 

下 面 的 算法 4. 19 系统 地 消除 了 文法 中 的 左 递归 。 如 果 文 法 中 不 存在 环 ( 即 形 如 4 之 4 的 推 
导 ) 或 e 产 生 式 ( 即 形 如 4-*e 的 产生 式 ) ;就 保证 能 够 消除 左 递归 。 环 和 e 产 生 式 都 可 以 从 文法 
中 系统 地 消除 ( 见 练习 4.4.6 和 练习 4.4.7)。 


消除 左 递归 。 

WA: 没有 环 或 e 产生 式 的 文法 Co 

输出 : 一 个 等 价 的 无 左 递归 文法 。 

方法 : 对 GC 应 用 图 4-11 中 的 算法 。 请 注意 ,得 到 的 非 左 递归 文法 可 能 具有 产生 式 。 ” 口 

图 4-11 中 的 过 程 的 工作 原理 如 下 。 在 ;i = 1 的 第 一 次 迭代 中 , 第 2 ~7 行 的 外 层 循环 消除 了 
Ay 产生 式 之 间 的 所 有 立即 左 递 归 。 因 此 ,余下 的 所 有 形 如 A1->Aia 的 产生 式 都 一 定 满足 1>1。 在 
外 层 循环 的 第 1-1 次 迭代 之 后 , 所 有 的 非 终 结 符号 4,(k< 让 都 被 “清洗 ”过 了 。 也 就 是 说 ; 任何 
产生 式 A, Aa 都 必然 满足 1>k。 结果 ,在 第 i 次 办 代 中 ,第 3 ~5 行 的 内 层 循环 不 断 提高 所 有 形 
WMA Ana 的 产生 式 中 m 的 下 界 , 直到 mS i 成立 为 止 。 然 后 ,第 6 行 消除 了 4; 产生 式 中 的 立即 
左 递归 , 保证 m >i 成 立 。 


1) ”按照 某 个 顺序 将 非 终 结 符号 排序 为 A1, 42，.… An: 

2) for ( 从 1 到 n 的 每 个 i) { 

3) for (从 1 到 i 一 1 的 每 个 了 ) { 

4) 将 每 个 形 如 Ai > Ajy 的 产生 式 替 换 为 产生 式 组 A; > diy | 627 | … | dey, 


} 
消除 生产 生 式 之 闻 的 立即 左 递归 





图 4-11 消除 文法 中 的 左 递归 的 算法 


我 们 将 算法 4. 19 应 用 于 文法 (4. 18) 。 从 技术 上 讲 , 因为 该 算法 有 产生 式 , 所 以 这 
个 算法 不 一 定 能 得 到 正确 结果 。 但 在 这 个 例子 中 , 最 终 会 证 明 产 生 式 4 一 *e 是 无 害 的 。 
我 们 将 非 终 结 符 号 排序 为 5, Ao TES 产生 式 之 间 没 有 立即 左 递归 , 因此 在 i=1 的 外 层 循环 
中 不 进行 任何 处 理 。 当 i=2 时 , RITER 4->Sd 中 的 S, 得 到 如 下 的 4 产生 式 。 
A>AclAadlbdle 
消除 这 些 4 产生 式 之 间 的 立即 左 递归 , 得 到 如 下 的 文法 : 
S—Aalb 
A—>b d A' | A’ ; 
A'—cA' ladA' le E 
4.3.4 提取 左 公 因子 
提取 左 公 因子 是 一 种 文法 转换 方法 ， 它 可 以 产生 适用 于 预测 分 析 技 术 或 自 顶 向 下 分 析 技 术 
的 文法 。 当 不 清楚 应 该 在 两 个 A 产生 式 中 如 何 选择 时 , 我 们 可 以 通过 改写 产生 式 来 推 后 这 个 决 
定 ， 等 我 们 读 人 了 足够 多 的 输入 ,获得 足够 信息 后 再 做 出 正确 选择 。 
比如 ,， 如果 我 们 有 两 个 产生 式 
stmt —if expr then stmt else stmt 
| if expr then stmt 
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在 看 到 输入 并 的 时 候 , 我 们 不 能 立刻 指出 应 该 选择 哪个 产生 式 来 展开 simt。 一 般 来 说 ,如 果 
Aap; | of) BIT APES, 并 且 输 入 的 开头 是 从 & 推导 得 到 的 一 个 非 空 串 ,那么 我 们 就 不 知 
道 应 该 将 4 展开 为 apy BE opr AT, 我 们 可 以 将 4 RFA aA”, 从 而 将 做 出 决定 的 时 间 往 后 
延 。 在 读 人 了 从 a 推导 得 到 的 输入 前 缀 之 后 , 我 们 再 决定 将 4' 展 开 为 Bi 或 B;。 也 就 是 说 , 经 过 
提取 左 公 因子 , 原来 的 产生 式 变 成 了 
A—aA' 
A'—B,| Bo 
对 一 个 文法 提取 左 公 因 子 。 
输入 :文法 Go 
输出 : 一 个 等 价 的 提取 了 左 公 因子 的 文法 。 
方法 : 对 于 每 个 非 终结 符号 4; 找 出 它 的 两 个 或 多 个 选项 之 间 的 最 长 公共 前 级 as MRa, 
即 存 在 一 个 非 平凡 的 公共 前 绥 , 那 么 将 所 有 4 产生 式 Aro, lapal lagal y RA 


A—aA' | y 
ABl By |---| B, 
其 中 ,y 表示 所 有 不 以 a 开头 的 产生 式 体 ;4' 是 一 个 新 的 非 终结 符号 。 不 断 应 用 这 个 转换 ,直到 每 
个 非 终结 符号 的 任意 两 个 产生 式 体 都 没有 公共 前 组 为 止 。 口 
了 下 面 的 文法 抽象 表 达 了 “悬空 -clse” 问题; 
Sot ESETET S eS lial (4.23) 


E—b 

XH i, t Alle (RH if, then 和 else; E Al S 表示“ 条件 表达 式 ” 和 “语句 ”。 提 取 左 公 因 子 后 , 这 
个 文法 变 为 : 

S—>iEtS S'la 

S’e Sle (4. 24) 

Eb 
这 样 ,我 们 可 以 在 输入 为 i 时 将 S 展开 为 igiSS', 并 在 处 理 ES 之 后 才 决 定 将 5' 展 开 为 eS 还 是 €。 
当然 ,上面 的 两 个 文法 都 是 二 义 性 的 ， 当 输入 为 。 时 不 能 够 确定 应 该 选择 5' 的 哪个 产生 式 。 例 子 
4. 33 将 讨论 一 个 可 以 摆脱 这 个 困境 的 方法 。 口 
4.3.5 ” 非 上 下 文 无 关 语言 的 构造 

在 常见 的 程序 设计 语言 中 ,可 以 找到 少量 不 能 仅 用 文法 描述 的 语法 构造 。 这 里 ,我 们 考虑 其 
中 的 两 种 构造 ,并 使 用 简单 的 抽象 语言 来 说 明 其 困难 之 处 。 

了 3 明 引 ”这 个 例子 中 的 语言 抽象 地 表示 了 检查 标识 符 在 程序 中 先 声 明 后 使 用 的 问题 。 这 个 语 
言 由 形 如 wew 的 捉 组 成 , 其 中 第 一 个 w 表示 某 个 标识 符 w 的 声明 ,表示 中 间 的 程序 片段 , 第 二 
个 w 表示 对 这 个 标识 符 的 使 用 。 

这 个 抽象 语言 是 五 = {wow lw 在 (alb)* 中 | 。 包含 了 所 有 符合 以 下 要 求 的 字 , 字 中 包含 
两 个 相同 的 由 “, b MARR, HELA c 隔 开 , 比如 aabcaab。 这 个 L 不 是 上 下 文 无 关 的 ,虽然 
证 明 这 一 点 已 经 超出 了 本 书 的 范围 。L 的 非 上 下 文 无 关 性 表明 了 像 C 或 Java 这 样 的 语言 不 是 上 
下 文 无 关 的 ， 因 为 这 些 语言 都 要 求 标识 符 要 先 声明 后 使 用 , 并 且 支 持 任意 长 度 的 标识 符 。 

出 于 这 个 原因 ，C 或 者 Java 的 文法 不 区 分 由 不 同 字符 串 组 成 的 标识 符 。 所 有 的 标识 符 在 文法 
中 都 被 表示 为 像 这 这 样 的 词法 单元 。 在 这 些 语言 的 编译 器 中 , 标识 符 是 否 先 声明 后 使 用 是 在 语 
义 分 析 阶 段 检查 的 。 口 
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这 个 例子 中 的 非 上 下 文 无 关 语言 抽象 地 表示 了 参数 个 数 检查 的 问题 。 它 检查 一 个 函 
数 声明 中 的 形式 参数 个 数 是 否 等 于 该 函数 的 某 次 使 用 中 的 实在 参数 个 数 。 这 个 语言 由 形 如 
anbmcndz HY BAM ICE a 表示 nn 个 &)。 这 里 ,a* Ab” 可 以 表示 两 个 分 别 有 n 和 m 个 参数 的 
函数 声明 的 形式 参数 列表 ; 而 c? M d” 分 别 表示 对 这 两 个 函数 的 调用 中 的 实在 参数 列表 。 

这 个 抽象 语言 是 L = {a"b™c"d™| n=l Amel}, CREN, L 包含 的 串 都 在 正则 表达 式 
a*b*c*d* 所 生成 的 语言 中 , 并 且 a 和 < 的 个 数 相同 , b 和 d 的 个 数 相 同 。 这 个 语言 不 是 上 下 文 
无 关 的 。 

同样 ， 函 数 声 明和 使 用 的 常用 语法 本 身 并 不 考虑 参数 的 个 数 。 比 如 , 一 个 类 C 语言 中 的 函数 
调用 可 能 被 描述 为 

stmt — id (expr_list) 
expr_list — expr_list , expr 
| expr - 
其 中 exp 另 有 适当 的 产生 式 。 检 查 一 次 调用 中 的 参数 个 数 是 否 正确 通常 是 在 语义 分 析 阶 段 完 
成 的 。 Oo 
4.3.6 4.3 节 的 练习 : 

练习 4.3.1: 下 面 是 一 个 只 包含 符号 a Mb 的 正则 表达 式 的 文法 。 它 使 用 + 替代 表示 并 运算 

的 字符 | ， 以 避免 和 文法 中 作为 元 符号 使 用 的 竖 线 相 混 消 ; 
rexpr—rexpr + rterm | rterm 
rterm—>rterm rfactor | rfactor 
rfactor—>rrfactor * | rprimary 
rprimary—a | b 

1) 对 这 个 文法 提取 左 公 因 子 。 

2) 提取 左 公 因子 的 变换 能 使 这 个 文法 适用 于 自 顶 向 下 的 语法 分 析 技术 吗 ? 

3) 提取 左 公 因子 之 后 , 从 原文 法 中 消除 左 递归 。 

4) 得 到 的 文法 适用 于 自 项 向 下 的 语法 分 析 吗 ? 

练习 4. 3.2: 对 下 面 的 文法 重复 练习 4. 3. 1: 

1) 练习 4.2.1 的 文法 。 

2) 练习 4.2.2(1) 的 文法 。 

3) 练习 4.2.2(3) 的 文法 。 

4) 练习 4.2.2(5) 的 文法 。 

5) 练习 4.2.2(7) 的 文法 。 

| 练习 4. 3.3: 下 面 文法 的 目的 是 消除 4. 3. 2 节 中 讨论 的 “悬空 else 二 义 性 ”: 

stmt — if expr then stmt 
| matchedSimt 
matchedStmt—if expr then matchedStmt else stmt 
| other 
说 明 这 个 文法 仍然 是 二 义 性 的 。 


4.4” 自 项 向 下 的 语法 分 析 
自 顶 向 下 语法 分 析 可 以 被 看 作 是 为 输入 串 构 造 语法 分 析 树 的 问题 , 它 从 语法 分 析 树 的 根 结 
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点 开始 ,按照 先 根 次 序 (如 2. 3. 4 节 中 所 讨论 的 ， 深度 优先 地 ) PREIAR AOTAN ETAS 
自 顶 向 下 语法 分 析 也 可 以 被 看 作 寻 找 输入 串 的 最 左 推导 的 过 程 。 
PEMA 5412 中 对 应 于 输入 ia + id * 这 的 语法 分 析 树 序列 是 一 个 根据 文法 (4.2) 进行 的 
最 左 推导 序列 。 这 里 重复 一 下 这 个 文法 : 
ET E' 
E'>+ TE' le 
TRT (4.28) 
T'>* FT'le' 
F—( E ) | id 
该 语法 分 析 树 序列 对 应 于 这 个 输入 的 一 个 最 左 推导 。 o 

在 一 个 自 顶 向 下 语法 分 析 的 每 一 步 中 , 关键 问题 是 确定 对 一 个 非 终结 符号 ( 比如 4) 应 用 哪 
个 产生 式 。 一 旦 选择 了 某 个 4 产生 式 , 语法 分 析 过 程 的 其 余部 分 负责 将 相应 产生 式 体 中 的 终结 
符号 和 输入 相 匹 配 。 

本 节 首 先 给 出 被 称 为 递归 下 降 语法 分 析 的 自 顶 向 下 语法 分 析 的 通用 形式 ,这 种 方法 可 能 需要 
进行 回溯 ,以 找到 要 应 用 的 正确 4 产生 式 。2. 4. 2 节 介绍 的 预测 分 析 技术 是 递 轨 下 降 分 析 技术 的 
一 个 特例 ， 它 不 需要 进行 回 湖 。 预 测 分 析 技术 通过 在 输入 中 向 前 看 固定 多 个 符号 来 选择 正确 的 4 
产生 式 。 通 常情 况 下 我 们 只 需要 向 前 看 一 个 符号 ( 即 只 看 下 一 个 输入 符号 ) 。 

比如 , 考虑 图 4-12 中 的 自 顶 向 下 语法 分 析 过 程 ， 它 构造 出 了 一 棵 语法 分 析 树 ， 其 中 有 两 个 标 
号 为 E' 的 结 点 。 在 (按照 前 序 遍 历次 序 的 ) 第 一 个 E' 结 点 上 选择 的 产生 式 是 E'— + 7 E'; 在 第 二 
个 ' 结 点 上 选择 的 产生 式 是 Ewe。 预测 分 析 器 通过 查看 下 一 个 输入 符号 就 可 以 在 两 个 E' 产 生 式 
中 选择 正确 的 产生 式 。 


E E E E 
i ey 和 全 lm xfs a ve = lm ms Xin we one 
/\ /\ /\ pa 
Ys i j T: i F j 人 + TE 
id id:e id € 
E = E => E 
lm > phe Im n Me lm zá T 
Kma Ws Pas á NS E KrK ps p! 
+ 
a AE iS [| ga 
1 € I € | 1 € | SIN. 
id id * F T' 
E E E 
im a ies iG = i % 
ra. pe pits ee yp (ps EI 
Ll Gf Se) MON ba NS | 
二 
id * f T * i T i i 7 
id id € id e€ 


图 4-12 id+id x id 的 自 顶 向 下 分 析 


对 于 有 些 文法 , 我 们 可 以 构造 出 向 前 看 个 输入 符号 的 预测 分 析 器 ,这 一 类 文法 有 时 也 称 为 
LL(%) 文 法 类 。 我 们 在 4.4.3 节 中 将 讨论 LL(1) 文 法 类 , 但 是 在 介绍 预备 知识 的 4. 4. 2 节 中 将 介 
绍 一 些 计算 FIRST 和 FOLLOW 集合 的 方法 。 根 据 一 个 文法 的 FIRST 和 FOLLOW 集合 ;我 们 将 构 
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造 出 “预测 分 析 表 ”, 它 说 明了 如 何在 自 顶 向 下 语法 分 析 过 程 中 选择 产生 式 。 这 些 集合 也 可 以 用 
于 自 底 向 上 语法 分 析 。 

在 4.4.4 节 中 , 我 们 给 出 了 一 个 非 递 归 的 语法 分 析 算 法 , 它 显 式 地 维护 了 一 个 栈 ; 而 不 是 通 
过 递归 调用 隐 式 地 维护 一 个 栈 。 最 后 , 我 们 将 在 4.4.5 节 中 讨论 自 顶 向 下 语法 分 析 过 程 中 的 错误 
恢复 问题 。 

4. 4. 1 递归 下 降 的 语法 分 析 

一 个 递归 下 降 语法 分 析 程 序 由 一 组 过 程 组 成 , 每 个 非 终 结 符号 有 一 个 对 应 的 过 程 。 程序 的 
执行 从 开始 符号 对 应 的 过 程 开 始 , 如 果 这 个 过 程 的 过 程 体 扫描 了 整个 输入 串 , 它 就 停止 执行 并 宣 
布 语法 分 析 成 功 完成 。 图 4-13 显示 了 对 应 于 某 个 非 终 绪 符 号 的 典型 过 程 的 伪 代 码 。 请 注意 ,这 个 
伪 代 码 是 不 确定 的 , 因为 它 没有 描述 如 何在 开始 时 刻 选择 A 产生 式 。 

通用 的 递归 下 降 分 析 技 术 可 能 需要 回溯 。 也 就 是 说 ; 它 可 能 需要 重复 扫描 输入 s 然而 ,在 对 
程序 设计 语言 的 构造 进行 语法 分 析 时 很 少 需要 回溯 守 因 此 需要 回溯 的 语法 分 析 器 并 不 常见 。 即 
使 在 自然 语言 语法 分 析 这 样 的 场合 , 回溯 也 不 是 很 高 效 , 因此 人 们 更 加 倾向 于 基于 表格 的 方法 ， 
比如 练习 4.4.9 中 的 动态 程序 规划 算法 或 者 Earley 方法 (参见 参考 文献 ) 。 

要 支持 回溯 ,就 需要 修改 图 4-13 的 人 代码。 首先, 因为 我 们 不 能 在 第 1 行 选 定 唯 三 的 4 产生 
A, 我 们 必须 按照 某 个 顺序 逐个 尝试 这 些 产生 式 ， 那 么 ;第 了 7 行 上 的 失败 并 不 意味 着 最 终 失 败 ， 
而 仅仅 是 建议 我 们 返回 到 第 1 行 并 尝试 另 一 个 4 产生 式 。 只 有 当 再 也 没有 4 产生 式 可 尝试 时 , 我 
们 才 会 宣称 找到 了 一 个 输入 错误 。 为 了 尝试 男 一 
个 4 产生 式 ; 我 们 需要 把 输入 指针 重新 设置 到 我 
们 第 一 次 到 达 第 1 行 时 的 位 置 。 因 此 ,需要 一 个 













void A() { 
1) 选择 一 个 4 FER, A > XiX Xi; 
2) for (i=1tok) { 


3) if ( Xi 是 一 个 非 终结 符号 ) 
局 部 变量 来 保存 这 个 输入 指针 ,以 供 将 来 回溯 时 | 4) 调用 过 程 Xi(); 
使 用 5) else if ( X; 等 于 当前 的 输入 符号 a ) 
: 6) 读 人 下 一 个 输入 符号 ; 










考虑 文法 else /* Se: T—/> Hi */; 
Sc Ad 
A>abla 
在 自 顶 向 下 地 构造 输入 溃 w = cad 的 语法 分 EAB “在 自 顶 向 下 语法 分 析 器 中 一 个 
析 树 时 , 初始 的 语法 分 析 树 只 包含 一 个 标号 为 5 非 终结 符号 对 应 的 典型 过 程 


的 结 点 ,输入 指针 指向 c, 即 风 的 第 一 个 符号 ; 5 s ; š 
自首 二 水 产生 式 】 因此 我 们 用 它 来 展开 3; 得 到 NEAN IN, 
图 4-14a 中 的 树 。 最 左边 的 叶子 结 点 的 标号 为 YAE | 
EMRA w 的 第 一 个 符号 匹配 , 因此 我 们 将 输入 eat f 
指针 推进 到 ia; 即 w 的 第 二 个 符号 ,并 考虑 下 一 
个 标号 为 本 的 叶子 结 点 。 sins eee gle 
现在 我 们 使 用 第 一 个 4 产生 式 Aab 来 展开 EE 
A, 得 到 图 4-14b 所 示 的 树 。 第 二 个 输入 符号 a 得 到 匹配 ,因此 我 们 将 输入 指针 推进 到 d， 即 第 三 
个 输入 符号 并 将 a 和 下 一 个 叶子 结 点 (标号 为 5) 比较 。 因 为 5 和 a 不 匹配 ,我 们 报告 失败 ,并 
HAA, 查看 是 否 还 有 尚未 尝试 过 、 但 有 可 能 匹配 的 其 他 4 产生 式 。 
在 回 到 4 时 , 我们 必须 把 输入 指针 重新 设置 到 位 置 2, 即 我 们 第 一 次 尝试 展开 4 时 该 指针 指 
向 的 位 置 。 这 意味 着 4 的 过 程 必须 将 输入 指针 存放 在 一 个 局 部 变量 中 。 
4 的 第 二 个 选项 产生 了 图 4-11e 所 示 的 树 。 叶 子 结 点 a 和 w 的 第 二 个 符号 匹配 , 叶子 结 点 4 


a) b) c) 
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和 第 三 个 符号 相 匹 配 。 因 为 我 们 已 经 产生 了 一 棵 w 的 语法 分 析 树 ， 所 以 我 们 停止 分 析 并 宣称 已 
成 功 完成 了 语法 分 析 。 o 

AER SC AEE A F MRT TREE A ERTER BEE E 
分 析 器 也 是 如 此 。 也 就 是 说 ， 当 我 们 试图 展开 一 个 非 终结 符号 4 的 时 候 , 我 们 可 能 会 没有 读 入 任 
何 输入 符号 就 再 次 试图 展开 4。 
4.4.2 FIRST 和 FOLLOW 

自 顶 向 下 和 自 底 向 上 语法 分 析 器 的 构造 可 以 使 用 和 文法 G 相关 的 两 个 函数 FIRST 和 FOL- 
LOW 来 实现 。 在 自 顶 向 下 语法 分 析 过 程 中 ; FIRST 和 FOLLOW 使 得 我 们 可 以 根据 下 一 个 输入 符 
号 来 选择 应 用 哪个 产生 式 。 在 铠 懂 模 式 的 错误 恢复 中 ,由 FOLLOW 产生 的 词法 单元 集合 可 以 作 
为 同步 词法 单元 。 

FIRST( a) 被 定义 为 可 从 ia 推导 得 到 的 串 的 首 符号 的 集 s 
合 , P a MERKOSSE MR a be 那么 e 也 在 A N T 
FIRST (a) 中 。 比 如 在 图 4-15 中 , 4 Soy, AE c 在 fi aa g 
FIRST(4) 中 。 è ir 

我 们 先 简单 介绍 一 下 如 何在 预测 分 析 中 使 用 FIRST。 考 
BPA A PER Aa |B, 其 中 FIRST(a) 和 FIRST(B) 是 不 
相交 的 集合 。 那 么 我 们 只 需要 查看 下 一 个 输入 符号 a, 就 可 : 
以 在 这 两 个 4 产生 式 中 进行 选择 。 因 为 a 只 能 出 现在 FIRST(a) 或 FIRST(B) 中 , 但 不 能 同时 出 现 
在 两 个 集合 中 。 比 如 , WR a 在 FIRST(B) 中 ,就 选择 4-3B。 在 4.4.3 中 定义 LL(1) 文 法 时 将 深入 
研究 这 个 思想 。 | 

对 于 非 终结 符号 4, FOLLOW(4) 被 定义 为 可 能 在 某 些 名 型 中 紧 跟 在 4 右边 的 终结 符号 的 集合 。 
也 就 是 说 , 如 果 存 在 如 图 4-15 所 示 形 如 S 性 ahap 的 推导 , 终结 符号 a 就 在 FOLLOW(4) 中 , 其 中 心 
和 是 文法 符号 串 。 请 注意 ,在 这 个 推导 的 某 个 阶段 ,4 和 a 之 间 可 能 存在 一 些 文法 符号 。 和 但 如 时 
这 样 , 这 些 符号 会 推导 得 到 e 并 消失 。 另 外 , 如 果 4 是 某 些 句 型 的 最 右 符号 , 那么 $ 也 在 
FOLLOW(4) 中 。 回忆 一 下 , $ 是 一 个 特殊 的 “结束 标记 ”符号 , 我 们 假设 它 不 是 任何 文法 的 符号 。 

计算 各 个 文法 符号 四 的 FIRST(X) 时 , 不断 应 用 下 列 规则 , 直到 再 没有 新 的 终结 符号 或 可 
以 被 加 入 到 任何 FIRST 集合 中 为 止 。 

1) 如 果 针 是 一 个 终结 符号 , 那么 FIRST(X) = X, 

2) 如 果 X 是 一 个 非 终结 符号 , BAXS YY, 是 一 个 产生 式 , 其 中 >1, 那么 如 果 对 于 某 个 
i, a 在 FIRST(Y;) 中 且 € 在 所 有 的 FIRST(Y,) , FIRST( Y3), «++, FIRST(Y;_,) H, 就 把 a 加 入 到 
FIRST(X) 中 。 也 就 是 说 ,了 1…Y;_1 考 e。 如 果 对 于 所 有 的 j=1, 2,…,k, @ 在 FIRST(Y) 中 ; 那么 
将 e 加 入 到 FIRST(X) 中 。 比 如 ,FIRST(Y ) 中 的 所 有 符号 一 定 在 FIRST(X) 中 如果 六 不 能 扒 
导出 e, 那么 我 们 就 不 会 再 向 FIRST(X) 中 加 入 任何 符号 , 但 是 如 果 Y Se, 那么 我 们 就 加 上 
FIRST( Y,) , 依 此 类 推 。 

3) 如 果 蕊 ve 是 一 个 产生 式 ; 那么 将 上 加 入 到 FIRST(2) 中 。 

现在 ,我 们 可 以 按照 如 下 方式 计算 任何 串 X XX, 的 FIRST 集合 。 向 FIRST(X, X---X,) 加 
人 五 (XX) 中 所 有 的 非 e 符 号 。 如 果 e Æ FIRST(X,) F, IA FIRST(X,) 中 的 所 有 非 e 符 号 ; 如 
果 e 在 FIRST(Xi) 和 FIRST(X,) 中 , 加 入 FIRST(X) 中 的 所 有 非 e 符 号 , 依 此 类 推 。 最后, 如 果 
对 所 有 的 i, 都 在 FIRST(X;) 中 , 那么 将 e 加 入 到 FIRST(X X, …X ) 中 。 

计算 所 有 非 终结 符号 4 的 FOLLOW(4) 集 合 时 ,不断 应 用 下 面 的 规则 , 直到 再 没有 新 的 终结 


图 4-15 终结 符号 c 在 FIRST(4) 
中 且 a 在 FOLLOW(4) 中 


语法 分 析 141 





符号 可 以 被 加 入 到 任意 FOLLOW 集合 中 为 止 。 

1) 将 $ 放 到 FOLLOW(S) 中 , 其 中 5 是 开始 符号 , 而 $ 是 输入 右 端的 结束 标记 。 

2) 如 果 存 在 一 个 产生 式 4 一 aB8, 那么 FIRST(B) 中 除 < 之 外 的 所 有 符号 都 在 
FOLLOW(B) 中 。 ' 

3) 如 果 存 在 一 个 产生 式 4 一 aB8, 或 存在 产生 式 4-*aBB H FIRST(B) 包含 < 那么 
FOLLOW(4) 中 的 所 有 符号 都 在 FOLLOW(B) 中 。 

DEJ 再 次 考虑 非 左 递归 的 文法 (4.28)。 那么 : 

1) FIRST(F) = FIRST(7) =FIRST(E) = | ( ,idl 。 要 知道 为 什么 ;请 注意 F 的 两 个 产生 式 的 
体 以 终结 符号 id 和 左 括号 开头 。7 只 有 一 个 产生 式 , 而 该 产生 式 的 体 以 开头。 又 因为 不 能 
推导 出 e; 所 以 FIRST T) BARA FIRST FF) 相 同 。 对 于 FIRST(E) 也 可 以 做 间 样 的 论 钙 。 

2) FIRST(E') =| +，,e|。 理 由 是 E' 的 两 个 产生 式 中 ;一 个 产生 式 的 体 以 终结 符号 开头， 
且 另 一 个 产生 式 的 体 为 e。 只 要 一 个 非 终结 符号 推导 出 6, 我 们 就 会 把 e 放 到 该 终结 符号 的 FIRST 
集合 中 。 

3) FIRST(7') = | * ,el 。 它 的 论证 过 程 和 FIRST( E') 的 论证 过 程 类 似 。 

4) FOLLOW(E) = FOLLOW(E') = {)，$ | 。 因 为 E 是 开始 符号 , FOLLOW(E) 二 定 包 含 
$o FERIE (E) 说 明了 右 括号 为 什么 在 FOLLOW(E) H, HFE, 请 注意 这 个 非 终结 符号 只 
出 现在 E 产生 式 的 体 的 尾部 ,因此 FOLLOW( E") 必然 和 FOLLOW(E) 相 同 。 

5) FOLLOW(7) =FOLLOW(7') = | +，) ，$ | 。 请 注意 ,7 在 产生 式 体 中 出 现时 只 有 E' 跟 在 
后 面 。 因 此 , FIRST(E’) PBR e 之 外 的 所 有 符号 一 定 都 在 FOLLOW (T) 中 。 这 解释 了 + 出 现在 
FOLLOW(7) 中 的 原因 。 然 而 ,因为 TIRST( 已 ) 包含 e( 即 尼 -e), 且 忆 就 是 在 互 产生 式 的 体 中 腿 
在 了 后面 的 全 部 符号 , 因此 FOLLOW(E) 中 的 所 有 符号 都 在 FOLLOW(7) 中 。 这 解释 了 符号 $ 和 
右 括号 出 现在 FOLLOW(T) PRA, EFT, 因为 它 只 出 现在 7 产生 式 的 尾部 , 因此 必然 有 
FOLLOW( 7’) = FOLLOW ( Tz . 

6) FOLLOW(F) = | + ，* ，) ，$ | 。 论 证 过 程 和 第 5 点 中 对 7 的 论证 过 程 类 似 。 口 
4.4.3 UL() 文 法 

对 于 称 为 LL(1) 的 文法 , 我 们 可 以 构造 出 预测 分 析 器 ， 即 不 需要 回 湖 的 递归 下 降 语法 分 析 
aro ILLO) 中 的 第 一 个 ”L” 表 示 从 左 向 右 扫 描 输 入 ,第 二 个 “L” 表 示 产 生 最 左 推导 , 而 “1” 则 
表示 在 每 一 步 中 只 需要 向 前 看 一 个 输入 符号 来 决定 语法 分 析 动作 。 


广 一 





预测 分 析 器 的 转换 图 

转换 图 有 助 于 将 预测 分 析 器 可 视 化 。 比 如 ,图 4-16a 中 显示 了 文法 (4. 28) 中 非 终结 符号 
和 的 转换 图 。 要 构造 一 个 文法 的 转换 图 ,首先 要 消除 左 递归 ,然后 对 文法 提取 左 公 因子 。 然 
后 对 每 个 非 终结 符号 4: 

1) 创建 一 个 初始 状态 和 一 个 结束 (返回 ) 状态 。 

2) 对 于 每 介 产 生 式 Amy X, Xp 和 ,创建 一 个 从 初始 状态 到 结束 状态 的 路 径 ,路径 中 各 条 
边 的 标号 为 五 X Ano WR 4 一 e, 那 么 这 条 路 径 就 是 一 条 标号 为 < 的 边 。 

顶 测 分 析 器 的 转换 图 和 词法 分 析 器 的 转换 图 是 不 同 的 。 分 析 器 的 转换 图 对 每 个 非 终 结 符 
号 都 有 一 个 图 。 图 中 边 的 标号 可 以 是 词法 单元 ,也 可 以 是 非 终结 符 号 。 词法 单元 上 的 转换 表 
示 当 该 词法 单元 是 下 一 个 输入 符号 时 我 们 应 该 执行 这 个 转换 。 非 终结 符号 4 上 的 转换 表示 对 
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| 4 的 过 程 的 一 次 调用 。 

对 于 一 个 LL(1) 文 法 ,将 e 边 作 为 默认 选择 可 以 解决 是 否 选 择 一 个 e 边 的 二 义 性 问题 。 

转换 图 可 以 化 简 ;前 提 是 各 条 路 径 上 的 文法 符号 序列 必须 保持 不 变 。 我 们 也 可 以 将 一 条 
标号 为 非 终结 符号 4 的 边 替换 为 4 的 转换 图 。 图 4-16a 和 图 4-16b 中 的 转换 图 是 等 价 的 : 如 果 
我 们 眼 踪 从 E 到 结束 状态 的 路 从 , 并 替换 那么 在 这 两 组 图 中 , 沿 着 这 些 路 径 的 文法 符号 都 
组 成 了 形 如 T+7T+…+7 的 串 。 图 4-16b 中 的 图 可 以 从 图 4-16a 通过 转换 而 得 到 。 转 换 的 方 
法 类 似 于 2. 5.4 节 所 述 的 方法 。 在 该 节 中 ， RACE AL ECP N RAE | 
| 一 个 非 终结 符号 的 相应 过 程 ， 








LL(1) 文 法 已 经 足以 描述 大 部 分 程序 设计 语言 构造 ， OESE E 需要 


多 加 小 心 。; HM, 左 递 归 的 文法 和 二 ,gp OAOE a 

义 性 的 文法 都 不 可 能 是 LL(1) 的 。 A 
一 个 文法 6 是 IL(1) 的 , MAM p: 

当 CHEE RAE AME ER oan en 

Aa | B 满 足下 面 的 条 件 : a) b) 


1) 不 存在 终结 符号 a 使 得 a 和 BB 图 4-16 文法 4.28 的 非 终结 符号 和 "的 转换 图 
都 能 够 推导 出 以 a FRKE 

2) a 和 BB 中 最 多 只 有 一 个 可 以 推导 出 空 串 。 

3) WEB Se, 那么 a 不 能 推导 出 任何 以 FOLLOW(4) 中 某 个 终结 符号 开头 的 串 。 类 似 地 ， 
如 果 a de, 那么 B 不 能 推导 出 任何 以 FOLLOW(4) 中 某 个 终结 符号 开头 的 串 。 

前 两 个 条 件 等 价 于 说 FIRST (cx) 和 FIRST(B6) 是 不 相交 的 集合 。 第 三 个 条 件 等 价 于 说 如 果 e 
在 FIRST(B) 中 , 那么 FIRST(a) 和 FOLLOW(4) 是 不 相交 的 集合 , 并 且 当 e 在 FIRST(a) 中 时 类 似 
结论 成 立 。 

之 所 以 能 够 为 LL(1) 文 法 构造 预测 分 析 器 , 原因 是 只 需要 检查 当前 输入 符号 就 可 以 为 一 外 
非 终结 符号 选择 正确 的 产生 式 。 因 为 有 关 控制 流 的 各 个 语言 构造 带 有 不 同 的 关键 字 ， 它们 通常 
满足 LL(1) 的 约束 。 比 如 , 如果 我 们 有 如 下 产生 式 

stmt —if (expr) stmt else stmt 
| while (expr) stmi 
| }stme_list} 

那么 关键 字 if, while 和 符号 | 告诉 我 们 : -如果 在 输入 中 找到 一 个 语句 ;哪个 产生 式 是 唯一 可 能 匹 
配 成 功 的 。 

接 下 来 给 出 的 算法 把 FIRST 和 FOLLOW 集合 中 的 信息 放 到 一 个 预测 分 析 表 MLA, a] 中。 这 
是 一 个 二 维 数组 , 其 中 4 是 一 个 非 终结 符号 ,a 是 一 个 终结 符号 或 特殊 符号 $ ， 即 输入 的 结束 标 
记 。 该 算法 基于 如 下 的 思想 : 只 有 当下 一 个 输入 符号 在 FIRST(w) 中 时 才 选 择 产 生 式 4 一 as 只 
有 当 w =e 时 , 或 更 加 一 般 化 的 a dett, 情况 才 有 些 复 杂 。 在 这 种 情况 下 ,如 果 当 前 输入 符号 在 
FOLLOW(4) 中 , 或 者 已 经 到 达 输 入 中 的 和 符号 且 $ 在 FOLLOW (A) 中 , 那么 我 们 仍 应 该 选 
aan 


构造 一 个 预测 分 析 表 。 
ppap a | 
输出 : 预测 分 析 表 M。 
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方法 ; 对 于 文法 6 的 每 个 产生 式 4->a; 进行 如 下 处 理 ; 

1) 对 于 FIRST(&a) 中 的 每 个 终结 符号 &, 将 4->a 加 入 到 M[4, a) Po 

2) 如 果 在 FIRST(a) 中 , 那么 对 于 FOLLOW(4) 中 的 每 个 终结 符号 5; 将 4-*a 加 入 到 
M[4, 5] 中 。 如 果 e 在 FIRST(a) 中 , 且 $ 在 FOLLOW(4) 中 , tK A>a MAAMA, $ ] 中 6 

在 完成 上 面 的 操作 之 后 , 如 果 MLA, a] 中 没有 产生 式 , WAK MLA, 四 设置 为 error( 我 们 通 
ee 一 个 空 条目 表 示 ) o oO 
对 于 表达 式 文法 (4 28) , 算法 4 31 生成 了 图 4.17 中 的 预测 分 析 表 。 空白 条 目 表示 错 
非 空白 的 条 目 中 指明 了 应 该 用 其 中 的 产生 式 来 扩展 相应 的 非 终结 符号 。 








输入 符号 











非 终结 符号 ia z es Cr 3 
E E>TE' EoTE 
E E' ++TE' E' +€|E' +e 
a To FT ToFT 
OY T'e |T «FT 下 一 el 了 一 
F F id F > (E) i 














图 4-17， 例 4. 32 的 预测 分 析 表 M 


考虑 产生 式 ETE’, AH 
FIRST( TE’) = FIRST(T) = {(, id} 

这 个 产生 式 被 加 到 M[E,(] 和 MLE, 这] 中 。 因 为 FIRST( + TE’) = | +}, PERE + 7E' 被 加 
人 到 M[E'，+ ] 中。 因为 FOLLOW(E') =|), $}, AK E' +e 被 加 入 到 MLE’, )] 和 
M[E'，$ ] 中 。 口 

算法 4. 31 可 以 应 用 于 任何 文法 6, 生成 该 文法 的 语法 分 析 表 歼 。 对 于 每 个 LL(I) 文 法 ,分 析 
表 中 的 每 个 条 目 都 唯一 地 指定 了 一 个 产生 式 , 或 者 标明 一 个 语法 错误 。 然 而 ,对 于 某 些 文法 ,W 
中 可 能 会 有 一 些 多 重 定义 的 条 目 。 比 如 , 如 果 G 是 左 递归 的 或 二 义 性 的 , WAM 至 少 会 包含 一 
个 多 重 定义 的 条 目 。 虽然 可 以 轻松 对 其 进行 消除 左 递 归 和 提取 左 公 因子 的 操作 ,但 是 仍然 存在 
一 些 这 样 的 文法 ,它们 不 存在 等 价 的 LL(1) 文 法 。 

下 面 例 子 中 的 语言 根本 没有 相应 的 LL(1) 文 法 。 
下 面 重复 一 下 例子 4. 22 中 的 文法 。 该 文法 抽象 地 表示 了 悬空 - else 的 问题 。 


































S—iEtSS’ | a | 
S' eS | e 
E—b 
这 个 文法 的 语法 分 析 表 显示 在 图 4-18 中 。M[LS'; e] 的 条 目 同时 包含 了 S'es 和 S'e. 
非 终结 符号 =n 
b € 1 
| S > iEtss’ 
S'e 
S'> eS 
En E+» | 











图 4-18 fi] 4. 33 的 分 析 表 M 
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这 个 文法 是 二 义 性 的 。 当 在 输入 中 看 到 e( 代表 else) 时 ， 解决 选择 使 用 哪个 产生 式 的 问题 就 
会 显露 出 此 文法 的 二 义 性 。 解决 这 个 二 义 性 问题 时 , 我 们 可 以 选择 产生 式 S'es. 这 个 选择 就 相 
当 于 把 else 和 前 面 最 近 的 then 关联 起 来 。 请 注意 ,选择 S'e 将 使 得 。 永远 不 可 能 被 放 到 栈 中 或 
者 从 输入 中 被 消除 ,因此 选择 这 个 产生 式 一 定 是 错误 的 。 Oo 
4.4.4 “ 非 递归 的 预测 分 析 

我 们 可 以 构造 出 一 个 非 递归 的 预测 分 析 器 , 它 显 式 地 维护 一 个 栈 结构 , 而 不 是 通过 递归 调用 
的 方式 隐 式 地 维护 栈 这 样 的 语法 分 析 器 可 以 模拟 最 左 推导 的 过 程 。 如 果 刀 是 至 今 为 止 已 经 亚 
配 完成 的 输入 部 分 , 那么 栈 中 保存 的 文法 符号 序列 'a 满足 

S Swa mla a ie] 

图 4-19 中 的 由 分 析 表 驱动 的 语法 分 析 器 有 一 
个 输入 缓冲 区 , 一 个 包含 了 文法 符号 序列 的 栈 ， 入 
一 个 由 算法 4. 31 构造 得 到 的 分 析 表 , 以 及 一 个 输 
出 流 。 它 的 输入 缓冲 区 中 包含 要 进行 语法 分 析 的 
串 ， 串 后 面 跟 有 结束 标记 $ 。 我 们 复 用 符号 $ 来 
标记 栈 底 。 在 开始 时 刻 , 栈 中 $ 的 上 方 是 开始 符 
号 So 图 4-19 一 个 分 析 表 驱动 的 预测 分 析 器 的 模型 

语法 分 析 器 由 一 个 程序 控制 。 该 程序 考虑 
栈 顶 符号 了 和 当前 输入 符号 a。 如 果 X 是 一 个 非 终结 符 号 , 该 分 析 器 查询 分 析 表 M 中 的 条 目 
MLX, a] 来 选择 一 个 X 产 生 式 。( 这 里 可 以 执行 一 些 附加 的 代码 ， 比 如 构造 一 个 语法 分 析 树 结 点 
的 代码 。) 否则 , 它 检 查 终结 符号 X 和 当前 输入 符号 a 是 否 匹 配 。 

这 个 语法 分 析 器 的 行为 可 以 使 用 它 的 格局 ( configuration) 来 描述 。 格 局 描述 了 栈 中 的 内 容 和 
余下 的 输入 。 下 面 的 算法 描述 了 如 何 处 理 格 局 。 
表 驱 动 的 预测 语法 分 析 。 

输入 : 一 个 串 w, 文法 C 的 预测 分 析 表 M, 

输出 : 如 果 久 在 L(G) 中 , 输出 w 的 一 个 最 左 推导 ; 否则 给 出 一 个 错误 指示 。 

方法 :最 初 , 语法 分 析 器 的 格局 如 下 : 输入 缓冲 区 中 是 w$ 而 G6 的 开始 符号 5 位 于 栈 项 , € 
的 下 面 是 $ 。 图 4-20 中 的 程序 使 用 预测 分 析 表 M 生成 了 处 理 这 个 输入 的 预测 分 析 过 程 。 E] 

Ra ip Etawa — AS , hip EAE 

令 X= 栈 顶 符号 ; 

while ( X Æ$ ) { /* #e4Eas */ 
if ( X EF ip PASHAN PES a) 执行 栈 的 弹出 操作 , 8 ip FATES — MLE: 
else if ( X 2—7}-447¥ ) error(); 


else if ( MI[X,a] 是 一 个 报错 条 目 ) error(); 
else if (MIX,al= X oY YY ) { 














IHT ENX > YY- Yk; 
弹出 栈 顶 符号 ; 
eV, Vers... Y1 BAR, Heh Yi TR. 


} 
& X= 栈 顶 符号 ; 





图 4-20 ”预测 分 析 算 法 
考虑 文法 (4. 28) 。 我 们 已 经 在 图 4-17 中 看 到 了 它 的 预测 分 析 表 。 处 理 输入 ia + ia * id 
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时 , 算法 4 34 的 非 递归 预测 分 析 器 顺序 执行 图 4-21 中 显示 的 各 个 步 又。 这 些 步骤 对 应 于 一 个 最 
左 推导 (完整 的 推导 过 程 见 图 4:12 ) : 











id + id + id$ 
id + id * id$ 
id + id * id$ 
id + id + id$ 
+ id * id§ 
+ id * id$ 
+ id « id$ 


id x id$ 

id x id$ 

id x id$ 

*id$ 

* id$ 

id$ 

id$ 
id + id xid 
id + id * id 
id + id * id 





图 4-21 对 输入 id + id” id BEAT TAI 4} PFE PLAT ER 
E= T E's F T'E'> id T E'= id E's id + T E'=--. 

请 注意 ,这 个 推导 中 的 各 个 句 型 对 应 于 已 经 被 匹配 的 输入 部 分 ( 见 图 中 的 已 匹配 列 ) 加 上 栈 中 
的 内 容 。 我 们 显示 已 匹配 输入 就 是 为 了 强调 这 种 对 应 关系 。 因为 同样 的 原因 , 在 图 中 将 栈 顶 显 
示 在 左边 。 当 我 们 考虑 自 底 向 上 语法 分 析 时 ， 将 栈 顶 显示 在 右边 会 更 加 自然 。 分 析 器 的 输入 指针 
指向 “输入 ” 列 中 的 串 的 最 左边 的 符号 。 回 
4. 4.5 预测 分 析 中 的 错误 恢复 

在 讨论 错误 恢复 时 要 考虑 一 个 由 分 析 表 驱动 的 预测 分 析 器 的 栈 ， 因为 这 个 栈 明确 地 显示 了 
语法 分 析 器 期 望 用 哪些 终结 符号 及 非 终结 符 号 来 匹配 余下 的 输入 。 这 个 技术 也 可 以 在 递归 下 降 
语法 分 析 过 程 中 使 用 。 

当 栈 项 的 终结 符号 和 下 一 个 输入 符号 不 匹配 时 ， 或 者 当 非 终结 符号 4 处 于 栈 顶 , a 是 下 一 个 
输入 符号 , A M[4， 9] 为 error( 即 相应 的 语法 分 析 表 条 目 为 空 ) 时 ， 预测 语法 分 析 过 程 就 可 以 检 
测 到 语法 错误 。 

恐慌 模式 

慌 慌 模式 的 错误 恢复 是 基于 下 面 的 思想 。 语法 分 析 器 忽略 输入 中 的 一 些 符号 ， 直到 输入 中 
出 现 由 设计 者 选 定 的 同步 词法 单元 集合 中 的 某 个 词法 单元 。 它 的 有 效 性 依赖 于 同步 集合 的 选取 。 
选取 这 个 集合 的 原则 是 应 该 使 得 语法 分 析 器 能 够 从 实践 中 可 能 遇 到 的 错误 中 快速 恢复 。 平面 是 
一 些 启发 式 规则 : 

1) 首先 将 FOLLOW(4) 中 的 所 有 符号 都 放 到 非 终结 符号 4 的 同步 集合 中 。 GOR BATA or Ze 
略 一 些 词法 单元 , 直到 碰 到 了 FOLLOW (A) 中 的 某 个 元 素 ， 然后 再 将 4 从 栈 中 弹出 , 那么 很 可 能 
语法 分 析 过 程 就 能 够 继续 进行 。 

2) 只 使 用 FOLLOW(4) 作 为 4 的 同步 集合 是 不 够 的 。 比 如 ,C 语言 用 分 号 表示 一 个 语句 结 
R, 那么 语句 开头 的 关键 字 可 能 不 会 出 现在 代表 表达 式 的 非 终结 符号 的 FOLLOW 集合 中 。 因 此 ， 
在 一 个 赋值 语句 之 后 遗漏 分 号 可 能 会 使 得 语法 分 析 器 忽略 下 一 个 语句 开头 的 关键 字 。 一 企 语言 
的 各 个 构造 之 间 常 常 存在 某 个 层次 结构 。 比如 , 表达 式 出 现在 语句 内 部 ， 而 请 句 出 现在 块 内 部 ， 
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等 等 。 我 们 可 以 把 较 高 层 构造 的 开始 符号 加 入 到 较 低层 构造 的 同步 集合 中 去 。 比 如 , 我 们 可 以 
把 语句 开头 的 关键 字 加 入 到 生成 表达 式 的 非 终结 符号 的 同步 集合 中 去 。 

3) 如 果 我 们 把 FIRST(4) 中 的 符号 加 入 到 非 终结 符号 4 的 同步 集合 中 , 那么 当 FIRST(4) 中 
的 某 个 符号 出 现在 输入 中 时 ,我们 就 有 可 能 可 以 根据 A 继续 进行 语法 分 析 。 

4) 如 果 一 个 非 终结 符号 可 以 生成 空 串 ,那么 可 以 把 推导 出 。 的 产生 式 当 作 默 认 值 使 用 。 这 
入 做 可 能 会 延迟 对 某 些 错误 的 检测 ,但 是 不 会 使 错误 被 漏 检 。 这 个 方法 可 以 减少 我 们 在 处 理 错 
误 恢复 时 需要 考虑 的 非 终结 符号 的 数量 。 

5) 如 果 楼 顶 的 一 个 终结 符号 不 能 和 输入 匹配 ,一 个 简单 的 想法 是 将 该 终结 符号 弹出 栈 ,并 

发 出 一 个 消息 称 已 经 插入 了 这 个 终结 符号 ,同时 继续 进行 语法 分 析 。 从 效果 上 看 ， 这 个 方法 是 将 
所 有 其 他 词法 单元 的 集合 作为 一 个 词法 单元 的 同步 集合 。 
EEJ 当 校 照 常用 的 表达 式 文法 (4.28) 对 表达 式 进行 语法 分 析 时 ,使 用 FIRST 和 FOLLOW 
符号 作为 同步 集合 就 能 够 很 好 地 完成 任务 。 图 4-17 中 此 文法 的 语法 分 析 表 在 图 4-22 中 再 次 给 
出 。 图 4.22 中 使 用 “synch” 来 表示 根据 相应 非 终结 符号 的 FOLLOW 集合 得 到 的 同步 词法 单元 。 
各 个 非 终结 符号 的 FOLLOW 集合 是 从 例子 4. 30 中 得 到 的 。 

图 4-22 中 的 分 析 表 将 按照 如 下 方式 使 用 。 如 果 语 法 分 析 器 查看 M[4，o] 并 发 现 它 是 空 的 ， 
那么 输入 符号 a 就 被 忽略 。 如 果 该 条 目 是 “syneh” ,那么 在 试图 继续 分 析 时 , 栈 项 的 非 终结 符号 
被 弹出 。 如 果 栈 顶 的 词法 单元 和 输入 符号 不 匹配 , 那么 我 们 就 按 上 述 方式 从 栈 中 弹出 这 个 单元 。 





















pants | nite. 
id + 
E EoTE' 
E' EB! 4+TE' 
iT T => FT' synch 
P Te |T' AFT 
F 五 一 id synch synch synch | synch 





图 4-22 ”加 入 到 图 4-17 的 预测 分 析 表 中 的 同步 词法 单元 








对 于 错误 输入 +id* + id, 语法 分 析 器 以 及 ro HA 说 明 
图 4-22 中 的 错误 恢复 机 制 的 工作 过 程 如 图 4-23 所 万 $ +id*+id$ Hiz, KE) 
一 idx+id$ id 在 FIRST 人 (五 ) 中 
示 。 全 | ids +id$ 
LW EPR eA | ide + ids 
虑 有 关 错误 消息 的 重要 问题 。 编 译 器 的 设计 者 必 Bee 
须 提 供 足 够 的 包含 有 用 信息 的 错误 消息 , 它 不 仅 pecan re 
描述 相应 的 错误 , 还 必须 引导 人 们 注意 错误 被 发 lids FER 
现 的 地 方 。 err 
短语 层次 的 恢复 / id$ 


短语 层次 错误 恢复 的 实现 方法 是 在 预测 语法 | ; e 
分 析 表 的 空白 条 目 中 填写 指向 处 理 例 程 的 指针 。 
这 些 例 程 可 以 改变 、 插 入 或 删除 输入 中 的 符号 ， 
并 发 出 适当 的 错误 消息 。 它 们 也 可 能 执行 一 些 出 
栈 操作 。 改 变 栈 中 符号 或 将 新 符号 压 入 栈 中 可 能 图 4-23 一 个 预测 分 析 器 所 做 的 
会 引起 一 些 问题 , 其 原因 有 多 个 。 首 先 , 由 语法 语法 分 析 和 错误 恢复 步骤 
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分 析 器 执行 的 动作 可 能 根本 不 对 应 于 语言 中 任何 句子 的 推导 过 程 。 第 二 ， 我 们 必须 保证 分 析 器 
不 会 陷 人 无 限 循环 。 防 止 出 现 无 限 循环 的 一 个 好 办 法 是 保证 任何 恢复 动作 最 终 都 会 消耗 掉 某 个 
输入 符号 ( 当 到 达 输 入 结尾 处 时 , 则 需要 保证 栈 中 的 内 容 会 变 少 ) 。 
4.4.6 4.4 节 的 练习 

练习 4. 4. 1: 为 下 面 的 每 二 个 文法 设计 一 个 预测 分 析 器 ， 并 给 出 预测 分 析 表 。 你 可 能 先 要 对 
文法 进行 提取 左 公 因子 或 消除 左 递归 的 操作 。 

1) 练习 4.2.2(1) 中 的 文法 。 

2) 练习 4.2.2(2) 中 的 文法 。 

3) 练习 4.2.2(3) 中 的 文法 。 

4) 练习 4.2.2(4) 中 的 文法 。 

5) 练习 4.2.2(5) 中 的 文法 。 

6) 练习 4.2.2(7) 中 的 文法 。 

I 练习 4. 4.2: 有 没有 可 能 通过 某 种 方法 修改 练习 4.2.1 中 的 文法 , 构造 出 一 个 与 该 练习 
中 的 语言 (运算 分 量 为 a 的 后 缀 表达 式 ) 对 应 的 预测 分 析 器 ? i 

练习 4. 4. 3: 计算 练习 4. 2. 1 的 文法 的 FIRST 和 FOLLOW 集合 。 

练习 4. 4.4: 计算 练习 4 2.2 中 各 个 文法 的 FIRST Al FOLLOW 集合 。 

练习 4.4.5: 文法 Sasa | aa 生成 了 所 有 由 “组 成 的 长 度 为 偶数 的 串 。 我 们 可 以 为 这 个 文 
法 设计 一 个 带 回溯 的 递归 下 降 分 析 器 。 如 果 我 们 选择 先 用 产生 式 Soa 展开 , 那么 我 们 只 能 识 
别 到 串 aas AIE, 任何 合理 的 递归 下 降 分 析 器 将 首先 尝试 Sasa, 

1) 说 明 这 个 递归 下 降 分 析 器 识别 输入 aa, aaaa 和 aaaaaaaa, 但 是 识别 不 了 caaaaa。 

1! 2) 这 个 递归 下 降 分 析 器 识别 什么 样 的 语言 ? 

下 面 的 练习 是 构造 任意 文法 的 “Chomsky 范式 ” 的 有 用 步骤 。Chomsky 范式 将 在 练习 4.4.8 
中 定义 。 

| 练习 4. 4. 6: 如 果 一 个 文法 没有 产生 式 体 为 e 的 产生 式 ( 称 为 e 产 生 式 ) ,那么 这 个 文法 就 
BAe FLAN. 

1) 给 出 一 个 算法 , 它 的 功能 是 把 任何 文法 转变 成 一 个 无 产生 式 的 生成 相同 语言 的 文法 ( 唯 
一 可 能 的 例外 是 空 串 一 一 没有 哪个 无 e 产生 式 的 文法 能 生成 e)。 提示: 首先 找 出 所 有 可 能 为 空 
的 非 终结 符号 。 非 终结 符号 可 能 为 空 是 指 它 (可 能 通过 很 长 的 推导 ) 生 成 €o 

2) 将 你 的 算法 应 用 于 文法 S—aSbS | bSaS | es 

| 练习 4.4.7; 单产 生 式 (single production) 是 指 其 产生 式 体 为 单个 非 终结 符号 的 产生 式 ， 即 
Jean AB 的 产生 式 , 其 中 4、B 为 任意 的 非 终结 符号 。 

1) 给 出 一 个 算法 , 它 可 以 把 任何 文法 转变 成 一 个 生成 相同 语言 (唯一 可 能 的 例外 是 空 串 ) 
的 、 无 e 产 生 式 、 无 单产 生 式 的 文法 。 提 示 : 首先 消除 e- 产 生 式 , 然后 找 出 所 有 满足 下 列 条 件 的 
非 终结 符号 对 4 AB, 存在 一 系列 单产 生 式 使 得 4 之 B。 

2) 将 你 的 算法 应 用 于 4.1.2 节 的 算法 (4.1)。 

3) 说 明 作 为 (1) 的 一 个 结果 , 我 们 可 以 把 一 个 文法 转变 为 一 个 没有 环 ( 即 对 某 个 非 终结 符号 

A 存在 一 步 或 多 步 的 推导 4 SA) 的 等 价 文法 。 

1! 练习 4. 4. 8: 如 果 一 个 文法 的 每 个 产生 式 要 么 形 如 4 一 BC, BAB Asa, H A, BA 
C 是 非 终 结 符号 ,而 a 是 终结 符号 , 那么 这 个 文法 就 称 为 Chomsky 范式 (Chomsky Normal Form, 
CNF) 文 法 。 说 明 如 何 将 任意 文法 转变 成 一 个 生成 相同 语言 (唯一 可 能 的 例外 是 空 串 一 一 没有 
CNF 文法 可 以 生成 e) 的 CNF 文法 。 
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1 练习 4.4.9: 对 于 每 个 具有 上 下 文 无 关 文 法 的 语言 , 其 长 度 为 的 串 可 以 在 0(n ) 的 时 间 
内 完成 识别 。 完 成 这 种 识别 工作 的 一 个 简单 方法 称 为 Cocke-Younger-Kasami( CYK) 算 法 。 该 算法 
基于 动态 规划 技术 。 也 就 是 说 ,给 定 一 个 串 aaa, 我 们 构造 出 一 个 nxn 的 表 了 使 得 Ty 是 可 
以 生成 子 串 aiai ,1…aj 的 非 终结 符号 的 集合 。 如 果 基 础 文法 是 CNF 的 ( 见 练习 4.4.8), 那么 只 要 
我 们 按照 正确 的 顺序 来 填 表 : 先 填 j -i 值 最 小 的 条 目 , 则 表 中 的 每 一 个 条 目 都 可 以 在 0(n) 时 间 
内 填写 完毕 。 给 出 一 个 能 够 正确 填写 这 个 表 的 条 目的 算法 , 并 说 明 你 的 算法 的 时 间 复 杂 度 为 
0(m )。 填 完 这 个 表 之 后 , 你 如 何 判 断 a14，…a 是 否 在 这 个 语言 中 ? 

! 练习 4. 4. 10: 说 明 我 们 如 何 能 够 在 填 好 练习 4.4.9 中 的 表 之 后 , 在 0(n) 时 间 内 获得 
a1a2…an 对 应 的 一 棵 语法 分 析 树 ? 提示 : 修改 练习 4.4.9 中 的 表 T, 使 得 对 于 表 的 每 个 条 目 7; 中 
的 每 个 非 终结 符号 4, 这 个 表 同 时 记录 了 其 他 条 目 中 的 哪 两 个 非 终结 符号 组 成 的 对 偶 使 得 我 们 将 
4 放 到 TF, 

! 练习 4. 4. 11: 修改 练习 4. 4. 9 中 的 算法 , 使 得 对 于 任意 符号 串 , 它 可 以 找 出 至 少 需 要 执行 
多 少 次 插入 、 删除 和 修改 错误 (每 个 错误 是 一 个 字符 ) 的 操作 才能 将 这 个 串 变 成 基础 文法 的 语言 
的 句子 。 

| 练习 4. 4. 12: 图 4-24 中 给 出 了 对 应 于 某 些 语句 的 文法 。 你 可 以 将 e 和 s 当 作 分 别 代表 条 
件 表达 式 和 “其 他 语句 ”的 终结 符号 。 如 果 我 们 按照 下 列 方法 来 解决 因为 展开 可 选 “else”( 非 终 





结 符号 stmi7az) 而 引起 的 冲突 : 当 我 们 从 输入 中 看 到 一 个 


list Tail 


; list 


—> if e then stmt stmtTail 
else 时 就 选择 消耗 掉 这 个 else。 使 用 4. 4: 5 节 中 描述 的 同 Ha ce 
步 符号 的 思想 : los 
1) 为 这 个 文法 构造 一 个 带 有 错误 纠正 信息 的 预测 分 | INT 下 sit 
析 表 。 list + stmt list Tail 
=. 
| 


2) 给 出 你 的 语法 分 析 器 在 处 理 下 列 输入 时 的 行为 : 


€ 





@ if e then s; if e then s end 
® while e do begin s ; if e then s ; end 


4.5 自 底 向 上 的 语法 分 析 


一 个 自 底 向 上 的 语法 分 析 过 程 对 应 于 为 一 个 输入 串 构 造 语法 分 析 树 的 过 程 ， 它 从 叶子 结 点 
(底部 ) 开 始 逐 渐 向 上 到 达 根 结 点 (顶部 )。 将 语法 分 析 描 述 为 语法 分 析 树 的 构造 过 程 会 比较 方 
便 , 虽然 编译 器 前 端 实际 上 不 会 显 式 地 构造 出 语法 分 析 树 , 而 是 直接 进行 翻译 。 图 4-25 中 显示 
的 分 析 树 的 快照 序列 演示 了 按照 表达 式 文法 (4: 1) 对 词法 单元 序列 id id 进行 的 自 底 向 上 语法 
分 析 的 过 程 。 


图 4-24 某 种 类 型 语句 的 文法 


id * id F x id T x id Te T E 
| | Lm /\\ | 

id F F id Te T 

| | Livy al viy 

id id p id hae) 

id F id 


图 4-25 idid 的 自 底 向 上 分 析 过 程 


本 节 将 介绍 一 个 被 称 为 移入 =- 归 约 语法 分 析 的 自 底 向 上 语法 分 析 的 通用 框架 。 我 们 将 在 4.6 
节 和 4.7 节 中 讨论 LR 文法 类 ,， 它 是 最 大 的 、 可 以 构造 出 相应 移 人 = 归 约 语法 分 析 器 的 文法 类 。 
虽然 手工 构造 一 个 LR 语法 分 析 器 的 工作 量 非常 大 , 但 借助 语法 分 析 器 自动 生成 工具 可 以 使 人 们 
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轻松 地 根据 适当 的 文法 构造 出 高 效 的 LR 分 析 器 。 本 节 中 的 概念 有 助 于 写 出 合适 的 文法 ,从 而 有 
效 利用 LR 分 析 器 生成 工具 。 实 现 语法 分 析 器 生成 工具 的 算法 将 在 4.7 节 中 给 出 。 
4.5.1 归 约 

我 们 可 以 将 自 底 向 上 语法 分 析 过 程 看 成 将 一 个 串 w“ 归 约 ”为 文法 开始 符号 的 过 程 。 在 每 个 归 
约 (reduction) 步 又 中 , 一 个 与 某 产生 式 体 相 匹配 的 特定 子 串 被 替换 为 该 产生 式 头 部 的 非 终结 符号 。 

在 自 底 向 上 语法 分 析 过 程 中 , 关键 问题 是 何 时 进行 归 约 以 及 应 用 哪个 产生 式 进行 归 约 。 
FE 图 4-25 中 的 快照 演示 了 一 个 归 约 序列 , 相应 的 文法 是 表达 式 文法 (4 1) 。 我 们 将 使 用 
如 下 的 符号 串 序 列 来 讨论 这 个 归 约 过 程 : 

id * id, F * id, T * id, T * F,T,E 

这 个 序列 中 的 符号 串 由 快照 中 各 相应 子 树 的 根 结 点 组 成 。 这 个 序列 从 输入 串 记 * id 开始 。 
第 一 次 归 约 使 用 产生 式 Fid, 将 最 左边 的 记 AA F, BAR F * id。 第 二 次 归 约 将 下 归 约 为 
T, EMT » id, 

PLE BATA URREN E TREHAN id 组 成 的 串 进行 归 约 , 其 中 7 是 7 的 休 , 而 
BA id È Fid 的 体 。 我 们 没有 将 7 归 约 为 ,而 是 将 第 二 个 i HAAF, BB Te F, I 
后 这 个 串 被 归 约 为 7。 最 后 将 7 归 约 为 开始 符号 ,从 而 结束 整个 语法 分 析 过 程 。 口 

根据 定义 ,一 次 归 约 是 一 个 推导 步 又 的 反 向 操作 (回顾 一 下 ,一 次 推导 步 又 将 名 再 中 的 一 个 
非 终结 符号 替换 为 该 符号 的 某 个 产生 式 的 体 ) 。 因 此 , 自 底 向 上 语法 分 析 的 目标 是 反 向 构造 一 个 
推导 过 程 。 下 面 的 推导 对 应 于 图 4-25 中 的 分 析 过 程 : 

E>T=>T * F=T «id=>F + id= id x id 
这 个 推导 过 程 实际 上 是 一 个 最 右 推导 。 
4.5.2 句柄 剪 枝 

对 输入 进行 从 左 到 右 的 扫描 ,并 在 扫描 过 程 中 进行 自 底 向 上 语法 分 析 , 就 可 以 反 向 构造 出 
个 最 右 推导 。 非 正式 地 讲 ,“ 句 柄 ”是 和 某 个 产生 式 体 匹配 的 子 串 , 对 它 的 归 约 代表 了 相应 的 最 
右 推导 中 的 一 个 反 向 步 又。 

比如 , 在 按照 表达 式 文法 (4. 1) 对 id, * id, 进行 语法 分 析 时 ,各 个 句柄 如 图 4-26 所 示 。 为 了 
表示 得 更 清楚 ,我 们 为 其 中 的 词法 单元 id MET FR BA TEPER EST 的 体 , 但 符号 7 并 
不 是 名 型 了 * id, 的 一 个 句柄 。 假 如 7 真 的 被 替换 为 E, RISAIE E xid, 而 这 个 串 不 能 从 开 
始 符号 推导 得 到 。 因 此 ,和 某 个 产生 式 体 匹配 的 最 左 子 串 不定 是 句柄 。 

正式 地 讲 , 如 果 有 S => aAw = aBw (如 图 
4-27 所 示 ), 那么 紧 跟 a 的 产生 式 AB 是 opw id, + idz 
的 一 个 自 杨 (handle) 。 换 名 话说 , RADA y | Pei 
的 一 个 句柄 是 满足 下 述 条 件 的 产生 式 4-B 及 | TF 
HB TE y 中 出 现 的 位 置 : 将 这 个 位 置 上 的 B 替 
换 为 4 之 后 得 到 的 串 是 y 的 某 个 最 右 推导 序列 Ad 
中 出 现在 位 于 y 之 前 的 最 右 句 型 。 过 程 中 出 现 的 句柄 

请 注意 , 句柄 右边 的 串 w 一 定 只 包含 终结 符号 。 为 方便 起 见 , 我 们 把 产生 式 体 6( 而 不 是 
4-B) 称 为 一 个 句柄 。 注 意 ,我 们 说 的 是 “一 个 句柄 ”, 而 不 是 “唯一 句柄 ”。 这 是 因为 文法 可 能 
是 二 义 性 的 , ow 可 能 存在 多 个 最 右 推导 。 如 果 一 个 文法 是 无 二 义 性 的 ,那么 该 文法 的 每 个 右 句 
型 都 有 且 只 有 一 个 句柄 。 

通过 “句柄 剪 枝 ” 可 以 得 到 一 个 反 向 的 最 右 推导 。 也 就 是 说 , 我 们 从 被 分 析 的 终结 符号 串 w 
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开始 .如 果 w 是 当前 文法 的 句子 , RAS w= yn Fy, 是 某 个 未 知 最 右 推导 的 第 个 最 右 


句 型 。 5 
S = yo 全 Yi PVN YY = w A ¥ x 
为 了 以 相反 顺序 重 构 这 个 推导 , 我 们 在 y, 中 寻找 句柄 B， 并 aes alana 


HB 替换 为 相关 产生 式 A, 8, 的 头 部 ,得 到 前 一 个 最 右 句 型 : 
y，_;。 请 注意 ,我 们 现在 还 不 知道 如 何 发 现 句柄 , 但 是 我 们 很 快 就 ”图 427 apu 的 语法 分 析 
会 介绍 多 个 寻找 句柄 的 方法 。 BEST toe 
然后 我 们 重复 这 个 过 程 。 也 就 是 说 , 我 们 在 yi 中 寻找 句柄 B,_;， 并 对 这 个 句柄 进行 归 约 ， 
得 到 最 右 句 型 y，,。 如 果 我 们 按照 这 个 过 程 得 到 了 一 个 只 包含 开始 符号 $ 的 最 右 句 型 ， 那 么 就 
可 以 停止 分 析 并 宣称 语法 分 析 过 程 成 功 完成 。 将 归 约 过 程 中 用 到 的 产生 式 反 向 排序 , 就 得 到 了 
输入 串 的 一 个 最 右 推导 过 程 。 
4.5.3 BA - 归 约 语法 分 析 技 术 

移 人 一 归 约 语法 分 析 是 自 底 向 上 语法 分 析 的 一 种 形式 。 它 使 用 一 个 栈 来 保存 文法 符号 ,并 
用 一 个 输入 缓冲 区 来 存放 将 要 进行 语法 分 析 的 其 余 符 号 。 我 们 将 看 到 , 句柄 在 被 识别 之 前 ,总 是 
出 现在 栈 的 顶部 。 

我 们 使 用 $ 来 标记 栈 的 底部 以 及 输入 的 右 端 。 按 照 惯 例 ,在 讨论 自 底 向 上 语法 分 析 的 时 候 ， 
我 们 将 栈 顶 显示 在 右 侧 ,而 不 是 像 在 自 顶 向 下 语法 分 析 中 那样 显示 在 左 侧 。 如 下 所 示 , 开始 的 时 
候 栈 是 空 的 , 并 且 输 入 串 w 存放 在 输入 缓冲 区 中 。 

栈 输入 
$ w$ 

在 对 输入 串 的 一 次 从 左 到 右 扫描 过 程 中 , 语法 分 析 器 将 零 个 或 多 个 输入 符号 移 到 栈 的 顶端 ， 
直到 它 可 以 对 栈 顶 的 一 个 文法 符号 串 B 进行 归 约 为 止 。 它 将 B 归 约 为 某 个 产生 式 的 头 。 语 法 分 
析 器 不 断 地 重复 这 个 循环 , 直到 它 检测 到 一 个 语法 错误 ,或 者 栈 中 包含 了 开始 符号 且 输 入 缓冲 区 
为 空 为 止 : 

栈 输入 
$5 $ 

当 进 入 这 样 的 格局 时 ,语法 分 析 器 停止 运行 , 并 宣称 成 功 完成 了 语法 分 析 。 图 4-28 显示 了 
一 个 移 和 人 - 归 约 语法 分 析 器 在 按照 表达 式 文法 (4.1) 对 输入 串 id, * id, 进行 语法 分 析 时 可 能 采 











取 的 动作 。 
虽然 主要 的 语法 分 析 操作 是 移入 和 归 约 , 但 实际 上 一 个 移 人 人 - 归 约 语法 分 析 器 可 采取 如 下 
四 种 可 能 的 动作 : OBA, QI, OH, @ 报 错 。 mA Hi 
1) 4A (shift) :将 下 一 个 输入 符号 移 到 栈 的 id ridas BA 
顶端 。 i 按照 F > id 归 约 
2) 归 约 (reduce) :被 归 约 的 符号 串 的 右 端 必然 > papain 
是 栈 顶 。 语 法 分 析 器 在 栈 中 确定 这 个 串 的 左 端 ， 并 pac A 
k EMNER EBB 按照 了 > T» FIH 
3) 接受 (accept) :宣布 语法 分 析 过 程 成 功 完成 。 ale 
4) 报错 (error) :发现 一 个 语法 错误 , 并 调用 一 
个 错误 恢复 子 例 程 。 图 4-28 ”一 个 移 人 - 归 约 语法 分 析 器 


我 们 之 所 以 能 够 在 移入 - 归 约 语法 分 析 中 使 用 在 处 理 输入 id, * id, 时 经 历 的 格局 


语法 分 析 ari 





栈 , 是 因为 这 个 分 析 过 程 具有 如 下 重要 性 质 : 句柄 总 是 出 现在 栈 的 顶端 ， 绝 不 会 出 现在 栈 的 中 
间 。 要 证 明 这 个 性 质 , 我 们 只 需要 考虑 任意 最 右 推导 中 的 两 个 连续 步骤 可 能 具有 的 形式 。 图 4-29 
演示 了 两 种 可 能 的 情况 。 在 情况 (1) 中 , 4 被 蔡 换 为 BBy, 然后 产生 式 体 BBy 中 最 右 非 终结 符号 如 


被 替换 为 y。 在 情况 (2) 中 , 4 仍然 首先 被 5, 

展开 , 但 这 次 使 用 的 产生 式 体 y 中 内 包含 终 也 i iy 

结 符号 。 下 一 个 最 右 非 终结 符号 B 将 位 于 i eae 

y 左 侧 的 菜 个 地 方 。 = re 入 所 分 全: 
换 句 话说 : 情况 (1) 情况 (2) 


1) SSaAz B 
Bii ir le i 图 4.29 一 个 最 右 推导 中 两 个 连续 步骤 的 两 种 情况 
2) 8 >aBxAz =aBxyz Dayxyz i 


反 向 考虑 情况 (1), 即 一 个 移入 - 归 约 语法 分 析 器 刚刚 到 达 如 下 格局 的 情况 : 


栈 输入 
$aBy yz $ 
语法 分 析 器 将 句柄 y 归 约 为 8, 从 而 到 达 如 下 格局 : 
$0B8B yz $ 
现在 ,语法 分 析 器 可 以 通过 零 次 或 多 次 移 人 动作 , 把 串 y 移 人 到 栈 的 上 方 ， 得 到 如 下 格局 : 
$apBy z$ 


其 中 ,句柄 BBy 位 于 栈 顶 ， 它 将 被 归 约 为 4。 

现在 考虑 情况 (2)。 在 格局 

Say xyz $ 
中 , 句柄 y 位 于 栈 顶 。 将 句柄 y 归 约 为 B 之 后 , 语法 分 析 器 可 以 把 串 %y BARE, 得 到 位 于 栈 项 
的 下 一 个 句柄 y。 该 句柄 可 以 被 归 约 为 4: 
$aBuy z$ 

在 这 两 种 情况 下 , 语法 分 析 器 在 进行 一 次 归 约 之 后 , 都 必须 接着 移入 零 个 或 多 个 符号 才能 在 
栈 顶 找到 下 一 个 句柄 。 因 此 它 从 不 需要 到 栈 中 间 去 寻找 句柄 。 
4.5.4 ØA - 归 约 语法 分 析 中 的 冲突 

有 些 上 下 文 无 关 文 法 不 能 使 用 移入 - 归 约 语法 分 析 技 术 。 对 于 这 样 的 文法 ， 每 个 移 人 - 归 
约 语 法 分 析 器 都 会 得 到 如 下 的 格局 : 即使 知道 了 栈 中 的 所 有 内 容 以 及 接 下 来 的 大 个 输入 符号 , 我 
们 仍然 无 法 判断 应 该 进行 移入 还 是 归 约 操作 (移入 / 归 约 冲突 ), 或 者 无 法 在 多 个 可 能 的 归 约 方法 
中 选择 正确 的 归 约 动作 ( 归 约 / 归 约 冲突 )。 现 在 我 们 给 出 一 些 语法 构造 的 例子 , 这些 构 造 的 文法 
可 能 会 出 现 这 样 的 冲突 。 从 技术 上 来 讲 , 这 些 文法 不 在 4.7 WEL LR) XARF, 我 们 把 它 
们 称 为 非 LR 文法 。LR(k) 中 的 表示 在 输入 中 向 前 看 个 符号 。 在 编译 中 使 用 的 文法 通常 属于 
LR(1) 文 法 类 , 即 最 多 只 需要 向 前 看 一 个 符号 。 
一 个 二 义 性 文法 不 可 能 是 LR 的 。 比 如 , 考虑 牛 3 节 中 的 悬空 -else 文法 (4. 14) : 

stmt— if expr then stmt 
| if expr then stmt else stmt 
| other 


如 果 我 们 有 一 个 移入 — 归 约 语法 分 析 器 处 于 格局 
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栈 输入 
… if expr then stmt else --- $ 
H, 那么 不 管 栈 中 证 expr then som 之 下 是 什么 内 容 ; 我 们 都 不 能 确定 它 是 否 是 句柄 。 这 里 就 出 现 
了 一 个 移入/ 归 约 冲突 。 根 据 输入 中 else 之 后 的 内 容 的 不 同 ,可 能 应 该 将 if expr then simt 归 约 为 
stnt， 也 可 能 应 该 将 else 移 人 然后 再 寻找 另 一 个 simt， 从 而 找到 完整 的 stimt 产生 式 体 if expr then 
stmt else stmt, 

请 注意 , 经 过 修正 的 移 和 人 - 归 约 语法 分 析 技术 可 以 对 某 些 二 义 性 文法 进行 语法 分 析 , 比如 上 
TIH if-then-else 文法 。 如 果 我 们 在 碰 到 else 时 选择 移 人 来 解决 移 人 / 归 约 冲突 ,语法 分 析 咒 就 会 
按照 我 们 的 期 望 运 行 , 也 就 是 将 每 个 else 和 前 一 个 尚未 匹配 的 then 相关 联 。 我 们 将 在 4.8 节 讨 
论 能 够 处 理 这 种 二 义 性 文法 的 语法 分 析 器 。 E 

另 一 个 常见 的 冲突 情况 发 生 在 我 们 确认 已 经 找到 句柄 的 时 候 。 在 这 种 情况 下 我 们 不 能 够 根 
据 栈 中 内 容 和 下 一 个 输入 符号 确定 应 该 使 用 哪个 产生 式 进 行 归 约 。 下 面 的 例子 说 明了 这 种 情况 。 

UER 假设 我 们 有 这 样 一 个 词法 分 析 器 ， 它 不 考虑 各 个 名 字 的 类 型 ,而 是 对 所 有 的 名 字 都 返 
回 词法 单元 名 ia。 假 设 我 们 的 语言 在 调用 过 程 时 会 给 出 过 程 名 字 , 并 把 调用 参数 放 在 括号 内 。 并 
且 假 设 引 用 数组 的 语法 与 此 相同 。 因 为 在 数组 引用 中 对 下 标的 翻译 不 同 于 过 程 调用 中 对 参数 的 
翻译 , 我 们 希望 使 用 不 同 的 产生 式 分 别 生成 实在 参数 列表 和 下 标 列 表 。 因 此 , 我 们 的 文法 包含 了 
图 4-30 中 所 示 的 产生 式 ( 还 包含 其 他 





1 stmt — id ( parameter_list ) 
产生 式 ) 。 (2) stmt —> expr := expr 
$ f ` vi Aa he pIE parameter list — parameter-list , parameter 

~B p( oe) ) 开头 的 请 名 将 以 词法 单 parameter_list — parameter 
元 流 id (id, id) 的 方式 输入 到 语法 分 析 絮 中 。 ; parameter — a ma 

ER a = expr 一 i expr_list 
归 约 语法 分 析 器 将 处 于 如 下 格局 中 : eapr-list 一， expr-list , expr 

栈 输入 expr_list 一 expr 
I 


“id(id sidi) ©: 图 4-30 ， 有 关 过 程 调用 和 数组 引用 的 产生 式 
显然 , 栈 顶 的 记 必须 被 归 约 , 但 使 用 哪个 产生 
式 呢 ? 如 果 p 是 一 个 过 程 , 那么 正确 的 选择 是 产生 式 (5) 但 如 果 p 是 一 个 数组 ,就 该 选择 产生 
式 (7) 。 栈 中 的 内 容 并 没有 指出 p 是 什么 ,必须 使 用 从 p 的 声明 中 获得 的 符号 表 中 的 信息 来 
确定 。 
解决 方法 之 一 是 将 产生 式 (1) 中 的 词法 单元 id 改 成 procid, 并 使 用 一 个 更 加 复杂 的 词法 分 析 
器 。 该 词法 分 析 器 在 识别 到 一 个 过 程 名 字 的 词素 时 返回 词法 单元 名 procid。 这 就 要 求 词法 分 析 
器 在 返回 一 个 词法 单元 之 前 先 查 询 符 号 表 。 
如 果 我 们 做 了 这 样 的 修改 , RAELE pG, j ) 的 时 候 , 语法 分 析 器 要 么 进入 格局 
栈 输入 
+++ procid ( id , id )--- 
要 么 进入 前 面 描述 的 格局 。 在 前 一 种 情况 下 , 我 们 选择 产生 式 (5 ) 进行 归 约 ; 在 后 一 种 情况 下 , 则 
选择 产生 式 (7) 进 行 归 约 。 请 注意 , 在 这 个 例子 里 , 栈 顶 之 下 的 第 三 个 符号 决定 了 应 该 执行 什么 
归 约 ,虽然 它 本 身 并 没有 被 归 约 。 移 入 - 归 约 的 语法 分 析 技术 可 以 使 用 栈 中 离 栈 顶 很 远 的 信息 
来 引导 语法 分 析 过 程 。 oO 
4.5.5 4.5 PHA 
练习 4.5.1: 对 于 练习 4. 2.2(a) 中 的 文法 S30 S1101, 指出 下 面 各 个 最 右 句 型 的 句柄 : 
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1) 000111 

2) 00S11 

34.5.2: WFAD 4210 KESHSS + 1SS * la 和 下 面 各 个 最 右 句 型 ,重复 练 
Rs bo 

1) SSS+ax* + 

2) SSta*at 

3) aaa*at++ 

练习 4. 5. 3: 对 于 下 面 的 输入 符号 串 和 文法 ,说 明 相 应 的 自 底 向 上 上 语法 分 析 过 程 s 

1) 练习 4.5.1 的 文法 的 串 000111。 

2) HY 4.5.2 WIE aaa * a t+, 


4.6 LR 语法 分 析 技 术 介 绍 : 简单 LR 技术 


目前 最 流行 的 自 底 向 上 语法 分 析 器 都 基于 所 谓 的 LR(E) 语 法 分 析 的 概念 。 其 中 ,“L” 表 示 
对 输入 进行 从 左 到 右 的 扫描 ,“R” 表 示 反 向 构造 出 一 个 最 右 推导 序列 , 而 表示 在 做 出 语法 分 析 
决定 时 向 前 看 个 输入 符号 。k =0 和 %=1 这 两 种 情况 具有 实践 意义 , 因此 这 里 我 们 将 只 考虑 
1 的 情况 。 当 省 略 (%) 时 , 我 们 假设 4=1。 

本 节 将 介绍 LR 语法 分 析 的 基本 概念 , 同时 还 将 介绍 最 简单 的 构造 移入 - 归 约 语法 分 析 器 的 
方法 。 这 个 方法 称 为 “简单 LR 技术 ”( 或 简称 为 SLR) BA LR 语法 分 析 器 本 身 是 使 用 语法 分 
析 器 自动 生成 工具 构造 得 到 的 , 但 对 基本 概念 有 所 了 解 仍然 是 有 益 的 。 我 们 首先 介绍 “项 ”和 
“语法 分 析 器 状态 ”的 概念 ， 一 个 LR 语法 分 析 器 生成 工具 给 出 的 诊断 信息 通常 会 包含 语法 分 析 
器 状态 。 我 们 可 以 使 用 这 些 状 态 分 离 出 语法 分 析 冲 突 的 源头 。 

4.7 节 将 介绍 两 个 更 加 复杂 的 方法 一 一 规范 LR 和 LALR。 它 们 被 用 于 大 多 数 的 LR 语法 分 析 
器 中 。 

4.6.1 为 什么 使 用 LR 语法 分 析 器 

LR 语法 分 析 器 是 表格 驱动 的 , 在 这 一 点 上 它 和 和 4 4. 4 节 中 提 到 的 非 递 归 LL 语法 分 析 器 很 相 
似 。 如 果 我 们 可 以 使 用 本 节 和 下 一 节 中 的 某 个 方法 为 一 个 文法 构造 出 语法 分 析 表 , 那么 这 个 文 
法 就 称 为 LR 文法 (LR grammar) 。 直 观 地 讲 , 只 要 存在 这 样 一 个 从 左 到 右 扫描 的 移入 - 归 约 语法 
分 析 器 ， 它 总 是 能 够 在 某 文法 的 最 右 句 型 的 句柄 出 现在 栈 顶 时 识别 出 这 个 句柄 , 那么 这 个 文法 就 
是 LR 的 。 

LR 语法 分 析 技 术 很 有 吸引 力 ,原因 如 下 : 

对 于 几乎 所 有 的 程序 设计 语言 构造 ， 只 要 能 够 写 出 该 构造 的 上 下 文 无 关 文法 ， 就 能 够 构 
造 出 识别 该 构造 的 LR 语法 分 析 器 。 确 实 存在 非 LR 的 上 下 文 无 关 文 法 , 但 一 般 来 说 , 常 
见 的 程序 设计 语言 构造 都 可 以 避免 使 用 这 样 的 文法 。 

LR 语法 分 析 方 法 是 已 知 的 最 通用 的 无 回溯 移入 - 归 约 分 析 技 术 , 并 且 它 的 实现 可 以 和 其 
他 更 原始 的 移入 - 归 约 方法 ( 见 参考 文献 ) 一 样 高 效 。 

一 个 LR 语法 分 析 器 可 以 在 对 输入 进行 从 左 到 右 扫 描 时 尽 可 能 早 地 检测 到 错误 。 

可 以 使 用 LR 方法 进行 语法 分 析 的 文法 类 是 可 以 使 用 预测 方法 或 LL 方法 进行 语法 分 析 的 
文法 类 的 真 超 集 。 一 个 文法 是 LR(E) 的 条 件 是 当 我 们 在 一 个 最 右 句 型 中 看 到 某 个 产生 式 
的 右 部 时 , 我 们 再 向 前 看 个 符号 就 可 以 决定 是 否 使 用 这 个 产生 式 进行 归 约 。 这 个 要 求 
比 LL(%) 文 法 的 要 求 宽松 很 多 。 对 于 LL(k) 文 法 ; 我们 在 决定 是 否 使 用 某 个 产生 式 时 ， 
只 能 向 前 看 该 产生 式 右 部 推导 出 的 串 的 前 个 符号 。 因 此 , LR 文法 能 够 比 LL 文法 描述 
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更 多 的 语言 就 一 点 也 不 奇怪 了 。 
LR 方法 的 主要 缺点 是 为 一 个 典型 的 程序 设计 语言 文法 手工 构造 LR 分 析 器 的 工作 量 非常 大 。 
我 们 需要 一 个 特殊 的 工具 , 即 一 个 LR 语法 分 析 器 生成 工具 。 幸 运 的 是 ,有 很 多 这 样 的 生成 工具 
可 用 , 我 们 将 在 4. 9 节 讨 论 其 中 最 常用 的 工具 Yace。 这 种 生成 工具 将 一 个 上 下 文 无 关 文法 作为 
输入 , 自动 生成 一 个 该 文法 的 语法 分 析 器 。 如 果 该 文法 含有 二 义 性 的 构造 ,或 者 含有 其 他 难以 在 
从 左 到 右 扫描 时 进行 语法 分 析 的 构造 , 那么 语法 分 析 器 生成 工具 将 对 这 些 构造 进行 定位 , 并 给 出 
详细 的 诊断 消息 。 
4.6.2 项 和 LR(0) 自 动机 
一 个 移入 - 归 约 语法 分 析 器 怎么 知道 何 时 进行 移 人 \ 何 时 进行 归 约 呢 ? 比如 ， 当 图 4-28 中 栈 
的 内 容 为 $ 了 而 下 一 个 输入 符号 是 * 时 , 语法 分 析 器 是 怎么 知道 位 于 栈 顶 的 7 不 是 句柄 , 因此 正 
确 的 动作 是 移 人 而 不 是 将 了 归 约 到 五 呢 ? 
一 个 LR 语法 分 析 器 通过 维护 一 些 状态 , 用 这 些 状 态 来 表明 我 们 在 语法 分 析 过 程 中 所 处 的 位 
署 ， 从 而 做 出 移入 二 归 约 决定 。 这 些 状 态 代 表 了 “项 ”(item) 的 集合 。 一 个 文法 C 的 一 个 LR(0) 
项 (简称 为 项 ) 是 C ty ONAL SR EINE MEFE WER SA a 因此 , 产生 式 A 一 XYZ 产 
生 了 四 个 项 : 
A— + XYZ 
A—>X + YZ 
A—>XY + Z 
A—>XYZ . 
FER 4 只 生成 一 个 项 4 一 ，。 








项 集 的 表示 
一 个 生成 自 底 向 上 语法 分 析 器 的 生成 工具 可 能 需要 便利 地 表示 项 和 项 集 。 请 注意 ,一 
项 可 以 表示 为 一 对 整数 ,第 一 个 整数 是 基础 文法 的 产生 式 编号 ,第 三 介 整 数 是 点 的 位 置 。 项 集 
可 以 用 这 些 数 对 的 列表 来 表示 。 然而 ,如 我 们 将 看 到 的 ,需要 用 到 的 项 集 通常 包含 * 闭 包 “项 ， 
这 些 项 的 点 位 于 产生 式 体 的 开始 处 。 这 些 项 总 是 可 以 根据 项 集中 的 其 他 项 重新 构造 出 来 , 因 
此 我 们 不 必 将 它们 包含 在 这 个 列表 中 。 











直观 地 讲 , 项 指明 了 在 语法 分 析 过 程 中 的 给 定点 上 , 我 们 已 经 看 到 了 一 个 产生 式 的 哪些 部 
分 。 比 如 , HA + XYZ 表明 我 们 希望 接 下 来 在 输入 中 看 到 一 个 从 XYZ 推导 得 到 的 串 。 项 
4 了 .YZ 说 明 我 们 刚刚 在 输入 中 看 到 了 一 个 可 以 由 推导 得 到 的 串 , 并 且 我 们 希望 接 下 来 看 到 
一 个 能 从 YZ 推导 得 到 的 串 。 项 4 一 XYZ. 表示 我 们 已 经 看 到 了 产生 式 体 XYZ, 已 经 是 时 候 把 
XYZ 归 约 为 4 了 。 

一 个 称 为 规范 LR(0) 项 集 族 (canonical LR(0) collection) 的 一 组 项 集 提 供 了 构建 一 个 确定 有 穷 
自动 机 的 基础 。 该 自动 机 可 用 于 做 出 语法 分 析 决 定 。 这 样 的 有 穷 自 动机 称 为 LR(0) 自动 机 2 。 更 明 
确 地 说 , 这 个 LR(0) 自动 机 的 每 个 状态 代表 了 规范 LR(0) 项 集 族 中 的 一 个 项 集 。 表 达 式 文法 (4. 1) 
的 对 应 的 自动 机 显示 在 图 4-31 中 。 我 们 将 把 它 用 做 讨论 规范 LR(0) 项 集 族 的 连续 使 用 的 例子 。 

为 了 构造 一 个 文法 的 规范 LR(0) 项 集 族 , 我 们 定义 了 一 个 增 广 文法 (augmented grammar) 和 


© 从 技术 上 讲 , 根 据 3. 6. 4 节 的 定义 ,这 个 自动 机 并 不 是 确定 自动 机 ,因为 我 们 没有 对 应 于 空 项 集 的 死 状 态 。 结 果 是 
有 一 些 状态 -输入 对 没有 后 继 状 态 。 
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两 个 函数 : CLOSURE 和 GOTO, WMR 8 是 一 个 以 S 为 开始 符号 的 文法 , 那么 6 的 增 广 文法 C 就 
是 在 6 中 加 上 新 开始 符号 S' 和 产生 式 5' 一 5 而 得 到 的 文法 。 引 入 这 个 新 的 开始 产生 式 的 目的 是 
告诉 语法 分 析 器 何 时 应 该 停止 语法 分 析 并 宣称 接受 输入 符号 串 。 也 就 是 说 , 当 且 仅 当 语 法 分 析 需 
要 使 用 规则 S'S 进行 归 约 时 ,输入 符号 串 被 接受 。 












































ee 


TF. 


图 4-31 表达 式 文法 (4.1) 的 LR(O) 自动 机 


项 集 的 闭 包 
如 果 7 是 文法 6 的 一 个 项 集 , 那么 CLOSURE (1) 就 是 根据 下 面 的 两 个 规则 从 工 构造 得 到 的 
项 集 : 
1) 一 开始 , 将 了 中 的 各 个 项 加 入 到 CLOSURE(7) 中 。 
2) WF Aa + BB 在 CLOSURE(7) 中 , Boy 是 一 个 产生 式 , 并 目 项 B>. y 不 在 CLOSURE(7) 
中 , 就 将 这 个 项 加 入 其 中 。 不 断 应 用 这 个 规则 , 直到 没有 新 项 可 以 加 入 到 CLOSURE(7) 中 为 止 。 
直观 地 讲 ，CLOSURE(7) 中 的 项 Ao + BB 表明 在 语法 分 析 过 程 的 某 点 上 , 我 们 认为 接 下 来 
可 能 会 在 输入 中 看 到 一 个 能 够 从 BB 推导 得 到 的 子 串 。 这 个 可 从 BB 推导 得 到 的 子 串 的 某 个 前 级 
可 以 从 8 推导 得 到 , 而 推导 时 必然 要 应 用 某 个 B 产生 式 。 因 此 我 们 加 入 了 各 个 B 产生 式 对 应 的 
项 , 也 就 是 说 , 如 果 Boy 是 一 个 产生 式 , WARNE B> - y 加 入 到 CLOSURE( 了 ) 中。 
ER 考虑 增 广 的 表达 式 文法 : 
E'—E 
E>E +TIT 
ToT x» FIF 
F—=(E) | id 
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如 果 了 是 由 一 个 项 组 成 的 项 集 { | E’. E]| , 那么 CLOSURE(7 了 ) 包 含 了 图 4-31 PHM Ly. 

下 面 说 明 一 下 如 何 计算 这 个 财 包 。 根 据 规则 (1) ; LE’ + E RRB) CLOSURE(7) 中。 因为 点 
的 右边 有 二 个 ,我 们 加 入 如 下 的 产生 式 , 点 位 于 产生 式 体 的 左 端 : E> + E+TMES-T, M 
在 ,后 一 个 项 中 有 一 个 7 在 点 的 右边 , ARMA TS TEAT -Fo FE, 位 于 点 右边 
的 政令 我 们 加 入 一 >. (E)A F> - id, 然后 就 不 再 需要 加 入 任何 新 的 项 。 口 

闭 包 可 以 按照 图 4-32 中 的 方法 计算 。 实 
现 函数 closure 的 一 个 便利 方法 是 设置 一 个 布 


SetOfltems CLOSURE(I) { 











repeat 


尔 数组 added, 该 数组 的 下 标 是 C 的 非 终结 符 for (J 中 的 每 个 项 4 -》a.BB ) 
号 。 当 我 们 为 各 个 B 产生 式 Boy 加 入 对 应 for ee ey) 
1 . y 
的 项 B + y th}, added[ B] 被 设置 为 true。 a ae 
请 注意 , 如 果 点 在 最 左 端的 某 个 B 产生 until 在 某 一 轮 中 没有 新 的 项 被 加 入 到 ,J 中 ; 


return J; 





式 被 加 入 到 工 的 闭 包 中 , 那么 所 有 了 产生 式 
都 会 被 加 入 到 这 个 闭 包 中 。 因 此 在 某 些 情况 
下 ,不 需要 真 的 将 那些 被 CLOSURE 函数 加 入 图 4-32 CLOSURE 的 计算 
到 了 中 的 项 B—> + y 列 出 来 ,只 需要 列 出 这 些 被 加 入 的 产生 式 的 左 部 非 终结 符号 就 足够 了 。 我 们 
将 感 兴趣 的 各 个 项 分 为 如 下 两 类 : 

1) 内 核 项 ; 包括 初始 项 5 一、. $ 以 及 点 不 在 最 左 端 的 所 有 项 。 

2) EARR: 除了 S> + 5 之 外 的 点 在 最 左 端的 所 有 项 。 

不 仅 如 此 ,我们 感 兴趣 的 每 一 个 项 集 都 是 某 个 内 核 项 集合 的 闭 包 ， 当然, 在 求 闭 包 时 加 入 的 
项 不 可 能 是 内 核 项 。 因 此 ,如 果 我们 抛弃 所 有 非 内 核 项 , 就 可 以 用 很 少 的 内 存 来 表示 真正 感 兴趣 
的 项 的 集合 ,因为 我 们 已 知 这 些 非 内 核 项 可 以 通过 闭 包 运算 重新 生成 。 在 图 4-31 中 , 非 内 核 项 位 
于 表示 状态 的 方 框 的 阴影 部 分 中 。 

GOTO 函数 

第 二 个 有 用 的 函数 是 COTO(7, X), 其 中 7 是 一 个 项 集 而 下 是 二 个 文法 符号 。GOTO(7, X) 被 
定义 为 1 中 所 有 形 如 [Aa + XB] 的 项 所 对 应 的 项 [4-*ax . B] 的 集合 的 闭 包 。 直 观 地 讲 ，GOTO 
函数 用 于 定义 一 个 文法 的 LR(0) 自动 机 中 的 转换 。 这 个 自动 机 的 状态 对 应 于 项 集 , 而 COTO (I, 
X) 描述 了 当 输 入 为 X 时 离开 状态 了 的 转换 。 
DEEI 如 果 1 是 两 个 项 的 集合 I[E' 一 E. ], [EE .+7]|, 那么 COTO(1，+ ) 包 含 如 
下 项 





E>E++T 
T=: TF 
T=. F 
E> CB) 
F— -id 
我 们 查找 7 中 点 的 右边 紧 跟 + 的 项 , 就 可 以 计算 得 到 GOTO(T,， +), EE . 不 是 这 样 的 项 ， 
但 EE . + 了 7 是 这 样 的 项 。 我们 将 点 移 过 + 号 得 到 ->E + . 7, 然后 求 出 这 个 单元 素 集合 的 
闭 包 。 O 
现在 我 们 可 以 给 出 构造 一 个 增 广 文法 6' 的 规范 LR (0) 项 集 族 C 的 算法 。 这 个 算法 如 图 4-33 
所 示 。 
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Akda OCIA (4.1) MIE LR(0) 项 集 族 和 GOTO 函数 如 图 4-31 所 示 。 其 中 , COTO 函数 用 图 





中 的 转换 表示 。 CO void items(G’) { 

LR(0) 自 动机 的 用 法 C ={CLOSURE({[S" + -S]})}; 

repeat 
“简单 LR 语法 分 析 技术 "( 即 SLR 分 į e E 
` ` r (每 个 文法 符号 ; 

析 技 术 ) 的 中 心思 想 是 根据 文法 构造 出 pier me a ESTIA] 
LR(0) 自动 机 。 这 个 自动 机 的 状态 是 规 将 GoTO(T,X) 加 入 @ 中 | 
范 LR(0) 项 集 族 中 的 元 素 而 它 的 转换 until 在 某 一 轮 中 没有 新 的 项 集 被 加 入 到 C 中 ; 
由 GOTO 函数 给 出 。 表 达 式 文法 (4.1) 的 
LR(0) 自 动机 已 经 在 前 面 的 图 4-31 中 显 图 4-33 规范 LR(0) 项 集 族 的 计算 
MA I o 


这 个 LR(0) 自动 机 的 开始 状态 是 CLOSURE( | [S'S]} ) ,其 中 5' 是 增 广 文法 的 开始 符号 。 
所 有 的 状态 都 是 接受 状态 。 我 们 说 的 “状态 ” 指 的 是 对 应 于 项 集 7 的 状态 : 

LR(0) 自动 机 是 如 何 帮 助 做 出 移 人 - 归 约 决定 的 呢 ? 移入 - 规约 决定 可 以 按照 如 下 方式 做 
出 。 假 设 文法 符号 串 y 使 PR(0) 自动 机 从 开始 状态 0 运行 到 某 个 状态 j。 那 么 如 果 下 二 个 输入 符 
号 为 a 且 状 态 7 有 一 个 在 a。 上 的 转换 , 就 移 人 a。 否 则 我 们 就 选择 归 约 动作 。 状 态 ; 的 项 将 告诉 我 
们 使 用 哪个 产生 式 进 行 归 约 。 

将 在 4. 6.3 节 中 介绍 的 LR 语法 分 析 算法 用 它 的 栈 来 跟踪 状态 及 文法 符 导 5 实际 卡 , 文法 符 
号 可 以 从 相应 状态 中 获取 , 因此 它 的 栈 只 保存 状态 。 下 面 的 例子 将 展示 如 何 使 用 一 个 LR(0) 自 
动机 和 一 个 状态 栈 来 做 出 移入 - 归 约 语法 分 析 决定 。 

4. 43 | 图 4-34 给 出 了 一 个 使 用 图 4-31 中 的 LR(0) 自动 机 的 移 人 - 归 约 语法 分 析 器 在 分 析 




















id * id 时 采取 的 动作 。 我 们 使 用 一 ” 刻 : T 
个 栈 来 保存 状态 。 为 清晰 起 见 , 栈 中 BARS 
状态 所 对 应 的 文法 符号 显示 在 “ 符 | ( i id 8 | 按照 > id 归 约 
号 " 列 中 。 在 第 1 行 , 栈 中 存放 了 自 UR ial 
动机 的 开始 状态 0, 相应 的 符号 是 栈 i on 
底 标记 $ 。 按照 也 > T x Fae 
下 一 个 输入 符号 是 这 ,而 状态 0 ee 
在 这 上 有 一 个 到 达 状 态 5 的 转换 。 





因此 我 们 选择 移 人 。 在 第 2 行 , 状态 图 4-34 id * id 的 语法 分 析 
5( 符 号 id) 已 经 被 压 人 到 栈 中 。 从 状态 5 出 发 没有 输入 + 上 的 转换 , 因此 我 们 选择 归 约 。 根 据 状 
态 5 PHS Pid ], 这 次 归 约 应 用 产生 式 Fyid。 

如 果 栈 中 保存 的 是 文法 符号 ， 那么 归 约 就 是 通过 将 相应 产生 式 的 体 (在 第 2 行 中 ,产生 式 的 
PARE id) 弹出 栈 并 将 产生 式 头 (在 这 个 例子 中 是 F) 压 入 栈 中 来 实现 的 。 现 在 栈 中 保存 的 是 状态 ， 
我 们 弹出 和 符号 id 对 应 的 状态 5, 使 得 状态 0 成 为 栈 顶 。 然后 我 们 寻找 一 个 F( 即 该 产生 式 的 头 
部 ) 上 的 转换 。 在 图 4-31 中 , 状态 0 有 -个 下 上 的 到 达 状 态 3 的 转换 , 因此 我 们 压 人 状态 3。 这 
个 状态 对 应 的 符号 是 王 , 见 第 3 行 。 

我 们 看 另 一 个 例子 , 考虑 第 5 行 , 状态 7( 符 号 * ) 位 于 栈 项 。 这 个 状态 有 一 个 id 上 的 到 达 状 
态 5 的 转换 ， 因 此 我 们 将 状态 5( 符 号 id) EAR, RAS 没有 转换 , 因此 我 们 按照 Fid 进行 
归 约 。 当 我 们 弹出 对 应 于 产生 式 体 ia 的 状态 5 后 , 状态 7 到 达 栈 项。 因为 状态 7 有 一 个 上 的 
转换 到 达 状 态 10, 我 们 压 入 状态 10( 符 号 F) 。 图 
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4.6.3 LR 语法 分 析 算 法 

图 4.35 中 显示 了 一 个 LR 语法 分 析 器 的 示意 图 。 它 由 一 个 输入 、 二 个 输出 、 AR 
动 程序 和 一 个 语法 分 析 表 组 成 。 这 个 分 析 表 包括 akue] 
两 个 部 分 (ACTION 和 GOTO), MA LR 语法 分 析 
器 的 驱动 程序 都 是 相同 的 ,而 语法 分 析 表 是 随 语 法 
分 析 器 的 不 同 而 变化 的 。 语 法 分 析 器 从 输入 缓冲 te 
区 逐个 读 入 符号 。 当 一 个 移入 - AIRED tt 
移 人 一 个 符号 时 ，LR 语法 分 析 器 移 人 的 是 一 个 对 
应 的 状态 。 每 个 状态 都 是 对 栈 中 该 状态 之 下 的 内 
容 所 含 信息 的 摘要 。 

分 析 器 的 栈 存 放 了 一 个 状态 序列 sos = 图 4-35 一 个 LR 语法 分 析 器 的 模型 
Hh s, ETR. Æ SLR 方法 中 ， Re LR(0) 自动 机 中 的 状态 , 规范 LR 和 LALR 方法 和 
SLR 方法 类 似 。 根 据 构造 方法 , 每 个 状态 都 有 一 个 对 应 的 文法 符号 。 回 顾 一 下 ， 各 个 状态 都 和 某 
个 项 集 对 应 ， 并 且 有 一 个 从 状态 i 到 状态 j 的 转换 当 且 仅 当 GOTO(1;, X) =Le 所 有 到 达 状 态 j 的 
转换 一 定 对 应 于 同一 个 文法 符号 X。 因 此 , 除了 开始 状态 0 之 外 ,每 个 状态 都 和 唯一 的 文法 符号 
HEIRS 。 

LR 语法 分 析 表 的 结构 

语法 分 析 表 由 两 个 部 分 组 成 : 一 个 语法 分 析 动 作 函 数 ACTION 和 一 个 转换 函数 GOTO, 

1) ACTION 函数 有 两 个 参数 :一 个 是 状态 i, 另 一 个 是 终结 符号 a( 或 者 是 输入 结束 标记 S ) 。 
ACTION[i a] 的 取 值 可 以 有 下 列 四 种 形式 : 

Q@ 移入 j, 其 中 j 是 一 个 状态 。 语 法 分 析 器 采取 的 动作 是 把 输入 符号 a 高效 地 移 人 栈 中 ， 但 
是 使 用 状态 j 来 代表 a。 

@ 归 约 4B。 语 法 分 析 器 的 动作 是 把 栈 项 的 B 高 效 地 归 约 为 产生 式 头 4。 

@ 接受 。 语 法 分 析 器 接受 输入 并 完成 语法 分 析 过 程 。 

@ 报错 。 语 法 分 析 器 在 它 的 输入 中 发 现 了 一 个 错误 并 执行 某 个 纠正 动作 。 我 们 将 在 4. 8.3 
节 和 4.9.4 节 中 进一步 讨论 这 样 的 错误 恢复 例 程 是 如 何 工作 的 。 

2) 我 们 把 定义 在 项 集 上 的 COTO 函数 扩展 为 定义 在 状态 集 上 的 函数 : 如 果 GOTO[1;, A] = 
那么 GOTO 也 把 状态 i 和 一 个 非 终结 符号 4 映射 到 状态 j。 

LR 语法 分 析 器 的 格局 

描述 LR 语法 分 析 器 的 行为 时 , 我 们 需要 一 个 能 够 表示 LR 语法 分 析 器 的 完整 状态 的 方法 。 
语法 分 析 器 的 完整 状态 包括 : 它 的 栈 和 余下 的 输入 。LR 语法 分 析 器 的 格局 ( configuration) 是 一 个 
形 如 : 












输出 





ACTION | GOTO 





(sosti Sma laal) pnb) 
的 对 。 其 中 ,第 一 个 分 量 是 栈 中 的 内 容 ( 右 侧 是 栈 顶 ) , 第 二 个 分 量 是 余下 的 输入 。 这 个 格局 表示 
了 如 下 的 最 右 句 型 
XXa X majai an 
它 表 示 最 右 句 型 的 方法 本 质 上 和 一 个 移入 - 归 约 语法 分 析 器 的 表示 方法 相同 。 唯 一 的 不 同 之 处 





Oo 其 着 命题 不 一 定 成 立 。 也 就 是 说 ,多 个 状态 可 能 对 应 于 同一 个 文法 符号 。 例 如 ,图 4-31 中 的 LR(0) 自动 机 的 状态 
1 和 8 ,进入 它们 的 都 是 下 上 的 转换 ;而 对 于 状态 2 和 9, 它 们 都 是 通过 7 了 上 的 转换 进入 。 
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在 于 栈 中 存放 的 是 状态 而 不 是 文法 符号 , 从 这 些 状态 能 够 复原 出 相应 的 文法 符号 。 也 就 是 说 ,X; 
是 状态 s; 所 代表 的 文法 符号 。 请 注意 ,so( 即 分 析 器 的 开始 状态 ) 不 代表 任何 文法 符号 , 它 只 是 作 
为 栈 底 标记 , 同时 也 在 语法 分 析 过 程 中 担负 了 重要 的 角色 。 

LR 语法 分 析 器 的 行为 

语法 分 析 器 根据 上 面 的 格局 决定 下 一 个 动作 时 , 首先 读 和 人 当前 输入 符号 a; 和 栈 顶 的 状态 sw， 

ee pi ATON a ee pe 
的 格局 如 下 : 

1) 如 果 ACTION[s,,, a;] =BAs, 那么 语法 分 析 器 执行 一 次 移 人 动作 ; 它 将 下 一 个 状态 移 
BEE, 进入 格局 

(S01 SmS ul nS ) 

符号 a; 不 需要 存放 在 栈 中 ， A 80) MEER = 恢复 出 a;。 现 
在 ,当前 的 输入 符号 是 a; 410 

2) 如 果 ACTION[s,,, a;] =MA AB, 那么 语法 分 析 器 执行 一 次 归 约 动作 , 进入 格局 

(8081 °**Sm—rS5 QiQi41"""Qn$ ) 

其 中 ,+r 是 B 的 长 度 , 且 s=GOTO[s,-,, A] EXE, 语法 分 析 器 首先 将 7 个 状态 符号 弹出 栈 , 使 
RE sn- FRM. AA ,语法 分 析 器 将 *( 即 条 目 GOTO[ s;,_,, AJKE) 压 人 栈 中 。 在 一 个 归 约 
动作 中 , 当前 的 输入 符号 不 会 改变 。 对 于 我 们 将 构造 的 LR 语法 分 析 器 ,对 应 于 被 弹出 栈 的 状态 
的 文法 符号 序列 Xm par Xm 总 是 等 于 B,， 即 归 约 使 用 的 产生 式 的 右 部 。 

在 一 次 归 约 动作 之 后 , LR 语法 分 析 器 将 执行 和 归 约 所 用 产生 式 关联 的 语义 动作 , 生成 相应 
的 输出 。 我 们 暂时 假设 输出 的 内 容 仅 仅 包 括 打 印 出 归 约 产生 式 。 

3) WMR ACTION[ sm, a;] = 接受 , 那么 语法 分 析 过 程 完成 。 

4) WR ACTION[s,,, a;] = 报错 , 则 说 明 语 法 分 析 器 发 现 了 一 个 语法 错误 ， 并 调用 一 个 错误 
恢复 例 程 。 

LR 语法 分 析 算法 总 结 如 下 。 所 有 的 LR 语法 分 析 器 都 按照 这 个 方式 执行 ， 两 个 LR 语法 分 析 
器 之 间 的 唯一 区 别 是 它们 的 语法 分 析 表 的 ACTION KMA GOTO 表 项 中 包含 的 信息 不 同 。 


LR 语法 分 析 算法 。 

输入 : MRAR w 和 一 个 LR 语法 分 析 表 ,这 个 表 描述 了 文法 G 的 ACTION 函数 和 GOTO 
函数 。 

输出 : 如 果 w 在 L(C) 中 , 则 输出 w 的 自 底 向 上 语法 分 析 过 程 中 的 归 约 步骤 ;否则 给 出 一 个 错 
误 指 示 。 

方法 :最 初 ,语法 分 析 器 栈 中 的 内 容 为 初始 状态 so, 输入 缓冲 区 中 的 内 容 为 w$ 。 然 后 ,语法 
分 析 器 执行 图 4-36 中 的 程序 。 图 
图 4-37 显示 了 表达 式 文法 (4.1) 的 一 个 LR 语法 分 析 表 中 的 ACTION 和 GOTO 函数 。 
下 面 再 次 给 出 文法 (4. 1) ,并 对 它们 的 产生 式 进行 编号 : 


(1) ESE +T (4) T=F 

(2) E >T (5) F>(E) 

(3) T—T* F (6) F—>id 
各 种 动作 在 此 图 中 的 编码 方法 如 下 : 


1) si 表示 移入 并 将 状态 i 压 栈 。 
2) 表示 按照 编号 为 j 的 产生 式 进 行 归 约 。 
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S a 为 w$ 的 第 一 个 符号 ; 
while(1) { /* 永远 重复 */ 
令 s 是 栈 顶 的 状态 ; 
if ( ACTION[s,a] = 移入 t+){ 
将 t 压 入 栈 中 ; 
令 gq 为 下 一 个 输入 符号 ; 
} else if ( ACTION[s, a] = 归 约 4 一 B){ 


从 栈 中 弹出 |8| 个 符号 ; 

Q t 为 当前 的 栈 顶 状态 ; 

将 GOTO[t, A] He ABER; 

输出 产生 式 4 > b; 
} else if ( ACTION[s, a] = 接受 ) break; /* 语法 分 析 完 成 */ 
else 调用 错误 恢复 例 程 ; 





图 4-36 LR 语法 分 析 程序 


3) ace 表示 接受 。 

4) 空白 表示 报错 。 

请 注意 , 对 于 终结 符号 a, COTO(s, a] 
的 值 在 ACTION 表 项 中 给 出 ;这 个 值 和 在 输入 
a 上 对 应 于 状态 s 的 移入 动作 一 起 给 出 。G0- 
TO 条 目 给 出 了 对 应 于 非 终 结 符号 4 的 
GOTO[s, 4] 的 值 。 我 们 还 没有 解释 图 4-37 
的 表 中 各 个 条 目 是 如 何 得 到 的 , 但 很 快 就 会 
来 处 理 这 个 问题 。 

在 处 理 输 入 id id + id 时 , 栈 和 输入 
内 容 的 序列 显示 在 图 4-38 中 。 为 清晰 起 见 ， 
图 中 还 显示 了 与 栈 中 状态 对 应 的 文法 符号 的 
序列 。 比 如 ,在 第 1 行 中 ,LR 语法 分 析 器 位 
于 状态 0 上 。 这 是 初始 状态 , 没有 对 应 的 文法 图 4-37 表达 式 文法 的 语法 分 析 表 
符号 , 而 第 一 个 输入 符号 是 id。 图 4-37 中 的 动作 部 分 第 0 行 、id 列 中 的 动作 是 5， 表示 应 该 移 
ÀA, 将 状态 5 压 栈 。 在 第 2 行 , 状态 符号 5 被 压 人 到 栈 中 , 而 id 从 输入 中 被 删除 。 
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id xid +id$ 
id *id+id$ 
F xid +id$ 
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根据 F > id Jaz 
RET >F 归 约 
移入 

移入 

根据 五 一 id 归 约 
根据 T 一 T x F 
根据 五 > T 归 约 
BA 

BA 

根据 五 一 id 归 约 
根据 T 一 Fae 
根据 E> E +T 
接受 


































(11) |0165 | E+id $ 
(12) | 0163, | E+F 


(13)|0169 | B+T 
aa joi (E 


图 4-38 一 个 LR 语法 分 析 器 处 理 输入 ia * id + id 的 各 个 步 又 
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然后 ，* 变 成 了 当前 的 输入 符号 , 而 状态 5 在 输入 为 * 时 的 动作 是 根据 产生 式 Fid 进行 归 
约 。 一 个 状态 符号 被 弹出 栈 。 然 后 ,状态 0 成 为 栈 顶 。 因为 状态 0 对 于 了 的 GOTO 值 是 3, 因此 状 
态 3 被 压 到 栈 中 。 现 在 我 们 得 到 第 3 行 中 的 格局 。 下 面 的 各 个 动作 的 执行 方式 与 此 类 似 。 E 
4.6.4 构造 SLR 语法 分 析 表 
构造 语法 分 析 表 的 SLR 构造 方法 是 研究 LR 语法 分 析 技 术 的 很 好 的 起 点 。 我 们 把 使 用 这 种 
方法 构造 得 到 的 语法 分 析 表 称 为 SLR 语法 分 析 表 , 并 把 使 用 SLR 语法 分 析 表 的 LR 语法 分 析 器 称 
为 SLR 语法 分 析 器 。 另 外 两 种 SLR 方法 通过 向 前 看 信息 来 增强 分 析 能 力 。 
SLR 方法 以 4.5 节 介绍 的 LR(0) 项 和 LR(0) 自动 机 为 基础 。 也 就 是 说 ,给 定 一 个 文法 C, 我 
们 通过 添加 新 的 开始 符号 $' 得 到 增 广 文法 GC'。 我 们 根据 C 构造 出 C' 的 规范 项 集 族 C 以 及 GOTO 
函数 。 
然后 ,使 用 下 面 的 算法 就 可 以 构造 出 这 个 语法 分 析 表 中 的 ACTION. 和 GOTO 条 目 。 它 要 求 我 
们 知道 输入 文法 的 每 个 非 终 结 符号 4 的 FOLLOW(4)( 见 4.4 节 )。 
构造 一 个 SLR 语法 分 析 表 。 
输入 : 一 个 增 广 文法 C 。 
输出 : 6' 的 SLR 语法 分 析 表 了 男 数 ACTION 和 GOTO, 
方法 : 
1) 构造 6' 的 规范 LR(0) 项 集 族 C= {10, h, °°, Into 
2) 根据 1 构造 得 到 状态 i。 状 态 ;的 语法 分 析 动 作 按照 下 面 的 方法 决定 : 
D 如 果 [4-xa: aB] 在 1 中 并 且 GOTO(L, a) =1;, 那么 将 ACTION[i, cj] 设置 为 “BAT” o 
这 里 a 必须 是 一 个 终结 符号 。 
© 如 果 [4a . EL H, 那么 对 于 FOLLOW(4) 中 的 所 有 a, 将 ACTION[i, a] 设 置 为 “ 归 
Hj Aa” o 这 里 4 不 等 于 5S'。 
@ 如 果 [S'S… ELP IAK ACTION, SIREN “EZ” 
如 果 根 据 上 面 的 规则 生成 了 任何 冲突 动作 , 我 们 就 说 这 个 文法 不 是 SLR(1) 的 。 在 这 种 情况 
F, 这 个 算法 无 法 生成 一 个 语法 分 析 器 。 
3) 状态 i 对 于 各 个 非 终结 符号 4 的 COTO 转换 使 用 下 面 的 规则 构造 得 到 : 如 果 GOTO(1;, A) 
=1,, 那么 GOTOLi, A] =j。 
4) 规则 (2) 和 (3) 没有 定义 的 所 有 条 目 都 设置 为 “报错 ”。 
5) 语法 分 析 器 的 初始 状态 就 是 根据 [S' 一 ，$] 所 在 项 集 构造 得 到 的 状态 。 O 
由 算法 4. 46 得 到 的 由 ACTION 函数 和 GOTO 函数 组 成 的 语法 分 析 表 被 称 为 文法 G 的 SLR(1) 分 
析 表 。 使 用 G 的 SLR(1) 分 析 表 的 LR 语法 分 析 器 称 为 G 的 SLR (1) 语 法 分 析 器 。 一 个 具有 
SLR(1) 语 法 分 析 表 的 文法 被 称 为 是 SLR(1) 的 。 我 们 常常 省 略 “SLR” 后 面 的 “(1)”, 因为 我 们 
不 会 在 这 里 处 理 向 前 看 多 个 符号 的 语法 分 析 器 。 
让 我 们 为 增 广 表达 式 文法 构造 SLR 分 析 表 。 这 个 文法 的 规范 LR(0) 项 集 族 如 图 4-31 
所 示 。 首 先 考 虑 项 集 D: 
E-e E 
E>- E +T 
E—>-T 
T— -T « F 
T eF 
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F= (E) 
F-> id 
KPH PF ( E ) AA ACTION[O, (] = 移 人 4, MF- id 使 得 条 目 ACTION[0， 

id] = 移 人 5。7 中 的 其 他 项 没有 生成 动作 。 现 在 考虑 五 : 

E'-E + 

EE: +T 
第 一 个 项 使 得 ACTION[ 1, $] = 接受 ,第 二 个 项 使 得 ACTION[1,，+]= 移 人 6。 下 一 步 
考虑 三: 


T—=T. x F 
因为 FOLLOW(E) = | .8 ，+，)| ,第 一 个 项 使 得 
ACTION[2, $] = ACTION[2, +] = ACTION[2, )] = B4 E>T 

第 二 个 项 使 得 ACTION[2，* ] = 移 信 7。 按照 这 个 方式 继续 推导 , 我 们 就 得 到 了 图 4-37 所 示 的 
ACTION 和 GOTO 表 。 在 该 图 中 , 归 约 动作 中 的 产生 式 编号 和 它们 在 原文 法 (4. 1) 中 的 出 现 顺序 
相同 。 也 就 是 说 , ESE + 了 的 编号 为 1, ET 的 编号 为 2, 依 此 类 推 。 o 
每 个 SLR(1) 文 法 都 是 无 二 义 性 的 , 但 是 存在 很 多 不 是 SLR(1) 的 无 二 义 性 文法 。 考 
虑 包含 下 列 产生 式 的 文法 : 

S>L= RIR 

L—* R | id (4.49) 

R>L 

将 上 入 分 别 看 作 代表 左 值 和 右 值 的 文法 符号 , 将 * 看 作 是 代表 “ 左 值 所 指向 的 内 容 ” 的 运 

AES 。 文 法 4. 49 对 应 的 规范 LR(0) 项 集 族 显示 在 图 4-39 中 。 





4-39 文法 (4. 49) 对 应 的 规范 LR(0) 项 集 族 





O 2.8.3 节 介绍 过 ,一 个 左 值 表示 了 一 个 内 存 位 置 , 而 右 值 是 一 个 可 以 存放 在 某 个 位 置 上 的 值 。 
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考虑 项 集 [,。 这 个 项 集中 的 第 一 个 项 使 得 ACTION[2，= ] 是 “ 移 人 6”。 因 为 FOLLOW(R) 
包含 = (考虑 推导 过 程 Sol =R> *R=R 即 可 知 原因 ) ,第 二 个 项 将 ACTION[2，= ] 设 置 为 “ 归 
A RL”。 因 为 在 ACTION[2，= ] 中 既 存 在 移入 条 目 又 存在 归 约 条 目 , 所 以 状态 2 在 输入 符号 
= 上 存在 移入 / 归 约 冲突 。 

文法 (4.49) 不 是 二 义 性 的 。 产 生 移 人 / 归 约 冲突 的 原因 是 构造 SLR 分 析 器 的 方法 功能 不 够 
强大 , 不 能 记 住 足够 多 的 上 下 文 信息 。 因 此 当 它 看 到 一 个 可 归 约 为 工 的 串 时 , 不 能 确定 语法 分 析 
器 应 该 对 输入 = 采取 什么 动作 。 接 下 来 讨论 的 规范 LR 方法 和 LALR 方法 将 可 以 成 功 地 处 理 更 大 
的 文法 类 型 , 包括 文法 (4. 49)。 然 而 请 注意 , 存在 一 些 无 二 义 性 的 文法 使 得 每 种 LR 语法 分 析 带 
构造 方法 都 会 产生 带 有 语法 分 析 动 作 冲 突 的 语法 分 析 动作 表 。 幸 运 的 是 , 在 处 理 程序 设计 语言 
时 ,一 般 都 可 以 避免 使 用 这 样 的 文法 。 天 
4.6.5 可 行 前 级 

为 什么 可 以 使 用 LR(0) 自动 机 来 做 出 移 人 - 归 约 决定 ? 对 于 一 个 文法 的 移入 - 归 约 语法 分 
析 器 , 该 文法 的 LR(0) 自动 机 可 以 刻画 出 可 能 出 现在 分 析 器 栈 中 的 文法 符号 串 。 栈 中 内 容 一 定 
是 某 个 最 右 句 型 的 前 级 。 如 果 栈 中 的 内 容 是 a 而 余下 的 输入 是 *， 那么 存在 一 个 将 ax 归 约 到 开 
始 符号 S 的 归 约 序列 。 用 推导 的 方式 表示 就 是 5 0x. 

然而 , 不 是 所 有 的 最 右 句 型 的 前 级 都 可 以 出 现在 栈 中 , 因为 语法 分 析 器 在 移 人 时 不 能 越过 名 
柄 。 比 如 , 假设 

ESF * id>(E) » id 

那么 在 语法 分 析 的 不 同时 刻 , 栈 中 存放 的 内 容 可 以 是 (、(E 和 (E), 但 不 会 是 (E) * ,因为 
(五 ) 是 句柄 , 语法 分 析 器 必须 在 移 人 * 之 前 将 它 归 约 为 了 。 

可 以 出 现在 一 个 移入 - 归 约 语法 分 析 器 的 栈 中 的 最 右 句 型 前 缀 被 称 为 可 行 前 组 (viable pre- 
fix)。 它 们 的 定义 如 下 : 一 个 可 行 前 级 是 一 个 最 右 句 型 的 前 缀 , 并 且 它 没有 越过 该 最 右 句 型 的 
最 右 句 柄 的 右 端 。 根 据 这 个 定义 , 我 们 总 是 可 以 在 一 个 可 行 前 弘之 后 增加 一 些 终结 符号 来 得 
到 一 个 最 右 句 型 。 

SLR 分 析 技术 基于 LR(0) 自动 机 能 够 识别 可 行 前 级 这 一 事实 。 如 果 存 在 一 个 推导 过 程 5 > 
oAw =a B1B2w， 我 们 就 说 项 AB). Bz 对 于 可 行 前 缀 of, 有 效 。 一 般 来 说 , 一 个 项 可 以 对 多 个 可 
行 前 级 有 效 。 

Ti AB, * Bs X api 有 效 的 事实 可 以 告诉 我 们 很 多 信息 。 当 我 们 在 语法 分 析 栈 中 发 现 0B, 
时 , 这 些 信 息 可 以 帮助 我 们 决定 是 进行 归 约 还 是 移入 。 特 别 是 ,如 果 B Ae, 那么 它 告 诉 我 们 句柄 
还 没有 被 全 部 移 人 到 栈 中 , 因此 我 们 应 该 选择 移 人 。 如 果 p =e, MARR AB, 就 是 句柄 ， 
我 们 应 该 按照 这 个 产生 式 进行 归 约 。 当 然 , 可 能 会 有 两 个 有 效 项 要 求 我 们 对 同一 个 可 行 前 绥 做 
不 同 的 事情 。 有 些 这 样 的 冲突 可 以 通过 查看 下 一 个 输入 符号 来 解决 ， 还 有 一 些 冲 突 可 以 通过 4. 8 
节 中 的 方法 来 解决 , 但 是 我 们 不 应 该 认为 将 LR 方法 应 用 于 任意 文法 所 产生 的 语法 分 析 动 作 冲 突 
都 可 以 得 到 解决 。 

对 于 可 能 出 现在 LR 语法 分 析 栈 中 的 各 个 可 行 前 组 , 我 们 可 以 很 容易 地 计算 出 对 应 于 这 些 可 
行 前 缀 的 有 效 项 的 集合 。 实 际 上 ，LR 语法 分 析 理 论 的 核心 定理 是 : 如 果 我 们 在 某 个 文法 的 
LR(0) 自 动机 中 从 初始 状态 开始 沿 着 标号 为 某 个 可 行 前 级"Yy 的 路 径 到 达 一 个 状态 , 那么 该 状态 对 
应 的 项 集 就 是 y 的 有 效 项 集 。 实 质 上 ,有效 项 集 包含 了 所 有 能 够 从 栈 中 收集 到 的 有 用 信息 。 我 
们 不 会 在 这 里 证 明 这 个 定理 , 但 我 们 将 给 出 一 个 例子 。 
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将 项 看 作 一 个 NFA 的 状态 
如 果 将 项 本 身 看 作 状 态 ,我 们 就 可 以 构造 出 一 个 识别 可 行 前 缀 的 不 确定 有 穷 自动 机 N。 
M Aa + XB Bl) AX :B 有 一 个 标号 为 X 的 转换 ,并 且 从 Aa . BB 到 8 一 . y 有 一 个 标号 
为 e 的 转换 。 那 么 项 ( 的 状态 ) 的 集合 1 的 CLOSURE (1) 44 RR 3.7.1 节 中 定义 的 一 个 
NFA 状态 集合 的 e 闭 包 。 由 NFA N 通过 子 集 构造 法 可 以 得 到 一 个 DFA, GOTO(7,X) 给 出 了 
这 个 DFA 中 状态 7 在 符号 X 上 的 转换 。 从 这 个 角度 看 ,图 4.33 中 的 过 程 items( G“ ) 就 是 将 子 
集 构 造 方法 应 用 于 以 项 作为 状态 的 NFA N 并 构造 出 DFA 的 过 程 。 | 











让 我 们 再 次 考虑 增 广 表达 式 文法 。 该 文法 的 项 集 和 COTO 函数 如 图 4.31 所 示 。 显 然 ， 
HE +T 是 该 文法 的 一 个 可 行 前 级 。 图 4-31 中 的 自动 机 在 读 人 已 + 7 * 之 后 将 位 于 状态 7 上。 
状态 7 中 包含 了 项 


ToT x -F 
ES E) 
F— + id 
它们 恰恰 就 是 +7* 的 有 效 项 。 为 了 说 明 原因 ， 考虑 如 下 三 个 最 右 推导 : 
E'=>E E'>E E'S E 
>E +7 >E +T >E Er 
>k iTo F Sel L A E Sb a E 
Seo td * CE ) >E + T * id 


第 一 个 推导 说 明 ToT * . 是 有 效 的 , BOE SAT Fo - CE ) 是 有 效 的 , 第 三 个 推导 
说 明了 有 -> id 是 有 效 的 。 可 以 证 明 E+T* 没有 其 他 的 有 效 项 , 但 我 们 并 不 会 在 这 里 证 明 这 个 
事实 。 O 
4.6.6 4.6 节 的 练习 
练习 4. 6, 1: 描述 下 列 文法 的 所 有 可 行 前 级 : 
1) 练习 4.2.2(1) 的 文法 S$、0S1101。 
1 2) 闵 了 4.2.1 的 文法 S38 138S « | a, 
! 3) 练习 4.2.2(3) 的 文法 S_»S ( S) le, 
练习 4. 6.2; 为 练习 4. 2. 1 中 的 ( 增 广 ) 文 法 构造 SLR 项 集 。 计算 这 些 项 集 的 GOTO 函数 。 给 
出 这 个 文法 的 语法 分 析 表 。 这 个 文法 是 SLR 文法 吗 ? 
练习 4. 6.3: 利用 练习 4.6.2 得 到 的 语法 分 析 表 ， 给 出 处 理 输入 aa * a + 时 的 各 个 动作 。 
练习 4. 6. 4: 对 于 练习 4.2.2(1) ~ (7) 中 的 各 个 ( 增 广 ) 文 法 ; 
1) 构造 SLR 项 集 和 它们 的 COTO 函数 。 
2) 指出 你 的 项 集中 的 所 有 动作 冲突 ， 
3) 如 果 存 在 SLR 语法 分 析 表 , 构造 出 这 个 语法 分 析 表 。 
练习 4. 6.5: 说 明 下 面 的 文法 
S-AaAb|BbBa 
Ae 
Boe 


是 LL(1) 的 , 但 不 是 SLR(1) 的 。 
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练习 4.6.6: 说 明 下 面 的 文法 
SoSAIA 
A—a 
是 SLR(1) 9, 但 不 是 LL(1) 的 。 
1! 练习 4. 6.7: 考虑 按照 下 面 方式 定义 的 文法 族 G: 
S—A; b; Hpisisn 
Aia; Ail aj Hr ep 

说 明 : 

1) CGA 2n? -n 个 产生 式 。 

2) C, 有 2"+m +n 个 LR(0) 项 集 。 

3) G, 是 SLR(1) 的 。 

关于 LR 语法 分 析 器 的 大 小 , 这 个 分 析 结 果 说 明了 什么 ? 

| 练习 4. 6. 8: 我 们 说 单个 项 可 以 看 作 一 个 不 确定 有 穷 自动 机 的 状态 , 而 有 效 项 的 集合 就 是 
一 个 确定 有 穷 自动 机 的 状态 ( 见 4.6.5 节 中 的 “将 项 看 作 一 个 NFA 的 状态 ”部 分 )。 对 于 练习 
4.2,.1 NAS SS.4+.1 S'S Fa: 

1) 根据 “将 项 看 作 一 个 NFA 的 状态 ”部 分 中 的 规则 , 画 出 这 个 文法 的 有 效 项 的 转换 图 
(NFA). 

2) 将 子 集 构造 算法 (算法 3. 20) 应 用 于 在 (1) 部 分 构造 得 到 的 NEA。 得 到 的 DPA 和 这 个 文法 
的 LR(0) 项 集 相 比 有 什么 关系 ? 

1! 3) 说 明 在 任何 情况 下 , 将 子 集 构造 算法 应 用 于 一 个 文法 的 有 效 项 的 NFA 所 得 到 的 就 是 


该 文法 的 LR(0) 项 集 。 
| 练习 4. 6. 9: 下 面 是 一 个 二 义 性 文法 : 
S—ASI15b 
A—SAla 


构造 出 这 个 文法 的 规范 LR(0) 项 集 族 。 如 果 我 们 试图 为 这 个 文法 构造 出 一 个 LR 语法 分 析 
K, 必然 会 存在 某 些 冲突 动作 。 都 有 哪些 冲突 动作 ? 假设 我 们 使 用 这 个 语法 分 析 表 , 并 且 在 出 现 
冲突 时 不 确定 地 选择 一 个 可 能 的 动作 。 给 出 处 理 输入 abab 时 的 所 有 可 能 的 动作 序列 。 


4.7 更 强大 的 LR 语法 分 析 器 


在 本 节 中 , 我 们 将 扩展 前 面 的 LR 语法 分 析 技 术 , 在 输入 中 向 前 看 一 个 符号 。 有 两 种 不 同 的 
方法 : ; 
1) “MLE LR” 方 法 , 或 直接 称 为 “LR” 方 法 。 它 充分 地 利用 了 向 前 看 符号 。 这 个 方法 使 用 
了 一 个 很 大 的 项 集 , 称 为 LR(1) 项 集 。 

2)“ 向 前 看 LR” ,或 称 为 “LALR” 方 法 。 它 基于 LR(0) 项 集 族 。 和 基于 LR(1) 项 的 典型 语法 
分 析 器 相 比 , 它 的 状态 要 少 很 多 。 通 过 向 LR(0) 项 中 小 心地 引入 向 前 看 符号 , 我 们 使 用 LALR 方 
法 处 理 的 文法 比 使 用 SLR 方法 时 处 理 的 文法 更 多 , 同时 构造 得 到 的 语法 分 析 表 却 不 比 SLR 分 析 
表 大 。 在 很 多 情况 下 , LALR 方法 是 最 合适 的 选择 。 

在 介绍 了 这 两 种 方法 之 后 , 我 们 将 在 本 节 的 结尾 讨论 如 何在 一 个 内 存 有 限 的 环境 中 建立 简 
洁 的 LR 语法 分 析 表 。 

4.7.1 规范 LR(1) 项 
现在 我 们 将 给 出 最 通用 的 为 文法 构造 LR 语法 分 析 表 的 技术 。 回 顾 一 下 , 在 SLR 方法 中 , 如 
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RIE I, 包含 项 [Awa . ], 且 当前 输入 符号 a 在 FOLLOW(4) 中 , 那么 状态 i 就 要 按照 4->a H 
行 归 约 。 然 而 在 某 些 情况 下 ， 当 状态 i 出 现在 栈 顶 时 , 栈 中 的 可 行 前 级 是 Ba 且 在 任何 最 右 名 型 
中 a 都 不 可 能 跟 在 pA 之 后 ,那么 当 输 入 为 a 时 不 应 该 按照 4->a 进行 归 约 。 
DENS 让 我 们 重新 考虑 例子 4. 48, 其 中 的 状态 2 包含 项 RL。。 这 个 项 对 应 于 上 面 讨论 的 
Aa, ii Al a 对 应 的 是 FOLLOW(R) 中 的 符号 =。 因 此, SLR 语法 分 析 器 在 下 一 个 输入 为 = 且 状 
态 为 2 时 要 求 按照 R>L 进行 归 约 (因为 状态 2 中 还 包含 项 SL =R, 它 同时 还 要 求 执行 移入 动 
作 ) RT, 例 4.48 的 文法 没有 以 =… 开 头 的 最 右 句 型 。 因 此 状态 2 只 和 可 行 前 缀 工 对 应 , E 
实际 上 不 应 该 执行 从 工 到 尺 的 归 约 。 口 

如 果 在 状态 中 包含 更 多 的 信息 , 我 们 就 可 能 排除 掉 一 些 这 样 的 不 正确 的 4-a 归 约 。 在 必要 
时 , 我 们 可 以 通过 分 裂 某 些 状态 , 设法 让 LR 语法 分 析 器 的 每 个 状态 精确 地 指明 哪些 输入 符号 可 
以 跟 在 句柄 a 的 后 面 , 从 而 使 a 可 能 被 归 约 成 为 A。 

将 这 个 额外 的 信息 加 入 状态 中 的 方法 是 对 项 进行 精 化 , 使 它 包含 第 二 个 分 量 , 这 个 分 量 的 什 
为 一 个 终结 符号 。 项 的 一 般 形 式 变 成 了 [4--*a +B, a], 其 中 A> 是 一 个 产生 式 ,而 a 是 一 个 终 
结 符号 或 右 端 结束 标记 $ 。 我 们 称 这 样 的 对 象 为 LR(1) 项 。 其 中 的 1 指 的 是 第 二 个 分 量 的 长 度 。 
第 二 个 分 量 称 为 这 个 项 的 向 前 看 符号 9S。 在 形 如 [4>a* p, a] 且 Bz 的 项 中 , 向 前 看 符号 没有 
任何 作用 , 但 是 一 个 形 如 [4 一 a ,aj 的 项 只 有 在 下 一 个 输入 符号 等 于 a 时 才 要 求 按照 4->a 进 
行 归 约 。 因 此 , 只 有 当 栈 顶 状 态 中 包含 一 个 LR(1) 项 [4 一 a , a], 我们 才 会 在 输入 为 "时 按照 
Aa 进行 归 约 。 这 样 的 a 的 集合 总 是 FOLLOW(4) 的 子 集 , 而 且 如 例 4. 51 所 示 , 它 很 可 能 是 一 
个 真子 集 。 

正式 地 讲 , 我 们 说 LR(1) 项 [4 一 a B, a] 对 于 一 个 可 行 前 缀 y 有 效 的 条 件 是 存在 一 个 推导 
5 壹 64w 过 6opBw， 其 中 

1) y = 6a, 且 

2) 要 么 a 是 w 的 第 一 个 符号 , 要 么 w 为 e 且 a 等 于 $。 
让 我 们 考虑 文法 

S—B B 
Ba B\ b 

该 文法 有 一 个 最 右 推导 S 这 aaBab =>aaaBab。 在 上 面 的 定义 中 , 令 8=aa, A=B, w=ab, a=a H 
B=B, 我 们 可 知 项 [B->a* B, a] 对 于 可 行 前 级 y =aaa 是 有 效 的 。 另 外 还 有 一 个 最 右 推导 S > 
BaB 一 BoaB。 根 据 这 个 推导 , 我 们 知道 项 [ Ba B, $ ] 是 可 行 前 缀 Baa 的 有 效 项 。 Oo 


4.7.2 构造 LR(1) 项 集 

构造 有 效 LR(1) 项 集 族 的 方法 实质 上 和 构造 规范 LR(0) 项 集 族 的 方法 相同 。 我 们 只 需要 修 
改 两 个 过 程 : CLOSURE 和 GOTO。 

为 了 理解 CLOSURE 操作 的 新 定义 ,特别 是 理解 为 什么 必须 在 FIRST (Ba) 中 , 我 们 考虑 对 
某 些 可 行 前 级 y 有 效 的 项 集合 中 的 一 个 形 如 [4-*a + BB,a] 的 项 ,那么 必然 存在 一 个 最 右 推导 
S Max-5aBgax， JEEP y = iu。 假设 Bax 推导 出 终结 符号 串 by, 那么 对 于 某 个 形 如 Bon 的 产生 
R, 我们 有 推导 SyBby 二 mbys Ai, [Bo +n, 6] 是 的 有 效 项 。 请 注意 ,6 可 能 是 从 B 推导 


日 ”当然 可 以 使 用 长 度 大 于 1 的 向 前 看 符号 串 。 但 是 这 里 我 们 不 考虑 这 样 的 向 前 看 符号 串 。 
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得 到 的 第 一 个 终结 符号 , 也 可 能 在 Bax by 的 推导 过 程 中 B 推导 出 了 e, 因此 也 可 能 是 a。 总 结 
这 两 种 情况 , 我 们 说 4 可 以 是 FIRST(pBax) 中 的 任意 终结 符号 , HP FIRST 是 在 4.4 节 中 定义 的 函 
数 。 请 注意 ,x 不 可 能 包含 by 的 第 一 个 终结 符号 ,因此 FIRST(Bax) = FIRST(pa)。 现 在 我 们 给 出 
LR(1) 项 集 的 构造 方法 。 
LR(1) 项 集 族 的 构造 方法 。 

输入 : 一 个 增 广 文法 Co 

输出 : LR(1) 项 集 族 , 其 中 的 每 个 项 集 对 文法 CG' 的 一 个 或 多 个 可 行 前 级 有 效 。 

方法 : 过 程 CLOSURE 和 GOTO, 以 及 用 于 构造 项 集 的 主 例 程 items 见 图 4- 40。 口 


SetOfltems CLOSURE(T) { 
repeat 
for ( 工 中 的 每 个 项 [4 > a-BB,a] ) 
for ( G' 中 的 每 个 产生 式 吾 一 7 ) 
for ( FIRST(Ba) 中 的 每 个 终结 符号 b ) 
将 [B > -7, 0] MARISA I; 
unt 让 不 能 向 T 中 加 入 更 多 的 项 ; 


return Í; 


SetOfltems GOTO(I, X) { 
将 了 初始 化 为 空 集 ; 
for (了 中 的 每 个 项 [A 一 a.XB,a]) 


将 项 [A > aX: p, a] MARRS JB; 
return CLOSURE(J); 


} 


void items(G') { 
将 C 初始 化 为 {CLOSURE}({[S" + -S, $]}); 
repeat 
for ( C 中 的 每 个 项 集 了 ) 
for (每 个 文法 符号 X ) 
if ( Goro(/, X) 非 空 且 不 在 C 中 ) 
将 coro(I, X)MAC#; 

until 不 再 有 新 的 项 集 加 入 到 CC 中 ; 





图 4-40 为 文法 0' 构 造 LR(1) 项 集 族 的 算法 


15 4. 54 58 FERA ee 
S'S 
SHEL (4.55) 
Cc Cl d 
PNA AHH | (S'>-S, $I} MA. CORA, RTM S' -S, $ ] 和 过 程 CLO- 
SURE 中 的 项 [4 一 a* BB, a] 相 匹配 。 也 就 是 说 ,4 =S, a=e, B=S, B= fla=$, KZ CLO- 
SURE 告诉 我 们 ,对 于 每 个 产生 式 By 和 FIRST(pBa) 中 的 终结 符号 5b, KU Bo - y, 5b] 加 入 到 闭 
包 中 。 对 于 当前 的 文法 , Boy 就 是 SCC, 并 且 因 为 B 是 e 且 a 是 $ ,5 只 能 是 $。 因 此 ,我们 
增加 [S 一 . CC, $]. 
我 们 继续 计算 闭 包 , 对 于 在 FIRST(C $ ) 中 的 8, 加 入 所 有 的 项 [C-…y,0]s。 也 就 是 说 ; 将 
[3 一 :CC，$ ] 和 [4 一 ac > BB, a] 相 匹配 , 我 人 有 4=5, a=e, B=C,B=CHa=$, ANCA 
会 推导 出 空 串 , 所 以 FIRST(C $) = FIRST(C)。 因 为 FIRST( C) 包 含 终结 符号 c Ad, MARN 
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MARL C+» eC, elx [C++ eC, d) [Ca d; el 和 [Cd rd] 在 这 些 项 中 ， 紧 靠 在 点 右边 
的 都 不 是 非 终 结 符号 , 因此 我 们 已 经 完成 了 第 一 个 LR(1) 项 集 。 这 个 初始 项 集 是 : 
h: S'S, $ 
S—>-CC, $ 
C+ cC, c/d 
C>- d, c/d 
为 表示 方便 , 我 们 省 略 了 方 插 号 , IFAM ALCO cC, cdj 作 为 两 个 项 [C 一 .ecC,， c] 和 
[C+ +cC, d] 的 缩写 。 
现在 我 们 对 不 同 的 外 值 计算 COTO( 有 ,XX)。 对 于 X=5， 我 们 必须 求 [S'S . ，$ 的 闭 包 。 
因为 点 在 最 右 端 ,所 以 无 法 加 入 新 的 项 。 因此 我 们 得 到 下 一 个 项 集 
Ti:S—»S.,$ 
对 于 X=C, 我 们 求 [ 5 一 C. C，$ ] 闭 包 。 我 们 以 $ 作为 第 二 个 分 量 加 入 C 产生 式 , 之 后 不 能 再 
加 入 新 的 项 , 得 到 : 
L:S—»C.C,$ 
C—*cC, $ 
C—-d, $ 
接 下 来 , 令 X= ec。 我们 必须 求 1[ C-e . C, c/d]} 的 闭 包 。 我 们 将 c/d 作为 第 二 个 分 量 加 入 C 产 
ER, 得 到 : 
L: Coe: C, c/d 
C>- cC, c/d 
C>- d, c/d 
最 后 , @X=d, 我 们 得 到 项 集 : 
I,; Cd:,c/d 
我 们 已 经 完成 了 石上 的 COTO 函数 。 我 们 没有 从 五 得 到 新 的 项 集 , 但 是 有 相对 于 C、c 和 的 
GOTO 后 继 。 对 于 COTO(1,, C), 我 们 有 
L: S+CC+, $ 
它 不 需要 进行 闭 包 运算 。 为 了 计算 COTO, c), RIII [Ce « C，$ ]} 求 闭 包 , 得 到 
Ig: C>e-C, $ 
C—> cC, $ 
C>-d, $ 
请 注意 ,16 和 五 只 在 第 二 个 分 量 上 有 所 不 同 。 我 们 会 经 常 看 到 一 个 文法 的 多 个 LR(1) 项 集 
具有 相同 的 第 一 分 量 , 但 第 二 分 量 不 同 。 当 我 们 为 同一 个 文法 构造 规范 LR (0) 项 集 族 时 ， 和 ”个 
LR(0) 项 集 将 和 一 个 或 多 个 LR(1) 项 集 的 第 一 分 量 集合 完全 一 致 。 我 们 将 在 讨论 LALR 语法 分 
析 技 术 的 时 候 更 加 深入 地 讨论 这 个 现象 。 
继续 计算 1, 的 GOTO PRK, GOTO(I,, d) 就 是 
l: C>d:, $ 
FUEL Fe MAE EE I, , Ty FE c Hd ER GOTO 值 分 别 是 和。GOTO(4, C) Æ 
Ig: C—rcC + , c/d 
I, MIs A GOTO fË, 因为 它们 的 项 中 的 点 都 在 最 右 端 。 1 HE Fld 上 的 GOTO 值 分 别 是 1 和 
l, 而 GOTO(16, C) Æ 
Ig: C—C., $ 
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其 余 的 各 个 项 集 都 没有 ,GOTO (A, 因此 我 们 完成 了 所 有 项 集 的 计算 。 图 4-41 显示 了 这 10 个 
项 集 和 它们 之 间 的 goto 关系 。 Oo 














7 T 
CocC.,$ 

















Ts ] 
C-+cC-,¢/d 








4-4] 文法 (4.55) 的 GOTO 图 


4.7.3 规范 LR(1) 语 法 分 析 表 

现在 我 们 给 出 根据 LR C1 ) 项 集 构造 LR(1 ) 的 ACTION 和 GOTO. 函数 的 规则 。 和 前 面 一 样 , 这 
些 函 数 将 用 一 个 表 来 表示 ,只 是 表格 条 目 中 的 值 有 所 不 同 。 
规范 LR 语法 分 析 表 的 构造 。 

输入 : 一 个 增 广 文法 6'。 

输出 : 6' 的 规范 LR 语法 分 析 表 的 函数 ACTION 和 COTO, 

方法 : 

1) 构造 6 的 LR(1) 项 集 族 C' = Hy, h, +) Ty) 

2) 语法 分 析 器 的 状态 i 根据 1; 构造 得 到 。 状 态 ;的 语法 分 析 动作 按照 下 面 的 规则 确定 : 

@ MR[ Ao + ap, b] 在 A 中, 并且 GOTO(1, a) =7 那么 将 ACTION[i,a] 设 置 为 “移入 
j”。 这 里 a 必须 是 一 个 终结 符号 。 

@ WEL Aa, aJI PEAS’, 那么 将 ACTION[i, a] 设 置 为 “规约 4a”。 

@ 如 果 [5'->S. ,，$ JER P, 那么 将 ACTION[i，$ ] 设 置 为 “接受 ”。 

如 果 根 据 上 述 规则 会 产生 任何 冲突 动作 , 我 们 就 说 这 个 文法 不 是 LR(1) 的 。 在 这 种 情况 下 ， 
这 个 算法 无 法 为 该 文法 生成 一 个 语法 分 析 器 。 

3) 状态 i 相对 于 各 个 非 终 结 符号 4 的 goto 转换 按照 下 面 的 规则 构造 得 到 : 如 果 GOTO(1,, A) 
= 也, HBA GOTOLi, A] =j。 

4) 所 有 没有 按照 规则 (2) 和 (3) 定 义 的 分 析 表 条 目 都 设 为 “报错 ”。 

5) 语法 分 析 器 的 初始 状态 是 由 包含 [ 3-，. S, $ ] 的 项 集 构造 得 到 的 状态 。 口 

由 算法 4 56 生成 的 语法 分 析 动作 和 COTO 函数 组 成 的 表 称 为 规范 LR(1) 语 法 分 析 表 。 使 用 这 
个 表 的 LR 语法 分 析 器 称 为 规范 LR(1) 语 法 分 析 器 。 如 果 语 法 分 析 动作 函数 中 不 包含 多 重 定义 的 条 
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自 , 那么 给 定 的 文法 就 称 为 LR(1) 文 法 和 前 面 一 样 ,在 大 家 都 了 解 的 情况 下 我 们 将 省 略 “(1)”。 
文法 (4.55) 的 规范 语法 分 析 表 如 图 4- 42 所 示 。 产 生 式 1、2 和 3 分 别 是 SCC, Co 
cC 和 Cd, H ACTION GOTO 

每 个 SLR(1) 文 法 都 是 LR(1) 文 法 。 但 是 对 于 一 个 SLR(1) 
文法 而 言 , 规范 LR(1) 语 法 分 析 器 的 状态 要 比 同一 文法 对 应 的 
SLR 语法 分 析 器 的 状态 多 。 前 一 个 例子 中 的 文法 是 SLR 的 , € 
的 SLR 语法 分 析 器 有 七 个 状态 ; 相 比 之 下 , 图 4- 42 中 有 十 个 
状态 。 

4.7.4 构造 LALR 语法 分 析 表 

现在 我 们 介绍 最 后 一 种 语法 分 析 器 构造 方法 ， 即 LALR( 向 
前 看 -LR) 技术 。 这 个 方法 经 常 在 实践 中 使 用 ,因为 用 这 种 方法 
得 到 的 分 析 表 比 规范 LR 分 析 表 小 很 多 , 而 且 大 部 分 常见 的 程序 ”图 4-42 文法 (4 55) 的 
设计 语言 构造 都 可 以 方便 地 使 用 一 个 LALR 文法 表示 。 对 于 规范 LR 语法 分 析 表 
SLR 文法 , 这 一 点 也 基本 成 立 ,只 是 仍然 存在 少量 构造 不 能 够 方便 地 使 用 SLR 技术 来 处 理 (例如 ， 
见 例 4.48)。 

我 们 对 语法 分 析 器 的 大 小 做 一 下 比较 。 一 个 文法 的 SLR 和 LALR 分 析 表 总 是 具有 相同 数量 的 
状态 , 对 于 像 C 这 样 的 语言 来 说 , 通常 有 几 百 个 状态 。 对 于 同样 大 小 的 语言 , 规范 LR 分 析 表 通常 
有 几 千 个 状态 。 因 此 , 构造 SLR 和 LALR 分 析 表 要 比 构造 规范 LR 分 析 表 更 容易 ， 而 且 更 经 济 。 

为 了 介绍 LALR ER, 让 我 们 再 次 考虑 文法 (4. 55) 。 该 文法 的 LR(1) 项 集 如 图 4- 41 所 示 。 
让 我 们 查看 两 个 看 起 来 差不多 的 状态 , EM 和 万。 它们 都 只 有 一 个 项 ,其 第 一 个 分 量 都 是 C 一 
d-o ELP, 向 前 看 符号 是 或 di; 在 万 中 ，$ 是 唯一 的 向 前 看 符号 。 

为 了 了 解 Ly 和 万 在 语法 分 析 器 中 担负 的 不 同 角色 , 请 注意 这 个 文法 生成 了 正则 语言 
c* de* d。 当 读 人 输入 ce…cdee…cd 的 时 候 , 语法 分 析 器 首先 将 第 一 组 以 及 跟 在 它们 后 面 的 d 
移入 栈 中 。 语 法 分 析 器 在 读 人 d 之 后 进入 状态 4。 然 后 ,当下 一 个 输入 符 号 是 < 或 4 时 , 语法 分 析 
器 按照 产生 式 Cod 进行 一 次 归 约 。 要 求 c 或 d 跟 在 后 面 是 有 道理 的 , 因为 它们 可 能 是 ce* a 中 的 
串 的 开始 符号 。 如 果 $ 跟 在 第 一 个 4 后 面 , 我 们 就 有 形 如 ced 的 输入 , 而 它们 不 在 这 个 语言 中 。 
如 果 $ 是 下 一 个 输入 符号 , 状态 4 就 会 正确 地 报告 一 个 错误 。 

语法 分 析 器 在 读 人 第 二 个 d 之 后 进入 状态 7。 然 后 ,语法 分 析 器 必须 在 输入 中 看 到 $ ,否则 
输 大 开头 的 符号 串 就 不 具有 c* de'd 的 形式 。 因 此 状态 7 应 该 在 输入 为 $ 时 按照 Cd 进行 归 
约 , 而 在 输入 为 c 或 d 的 时 候 报 告 错误 。 

现在 ,我 们 将 ALL, BRN Las 即 和 的 并 集 。 这 个 项 集 包含 了 LC-*d，,c/d/ $ IAR 
RWZI. FREMA d EM b: hsh BURG R h H goto 关系 现在 都 到 达 J47。 状 态 47 在 所 
有 输入 上 的 动作 都 是 归 约 。 这 个 经 过 修改 的 语法 分 析 器 行为 在 本 质 上 和 原 分 析 器 一 样 。 虽 然 在 
有 些 情况 下 , 原 分 析 器 会 报告 错误 , 而 新 分 析 器 却 将 a 归 约 为 C。 比如 , 在 处 理 cod 或 edede 这 样 
的 输入 时 就 会 出 现 这 样 的 情况 。 新 的 分 析 器 最 终 能 够 找到 这 个 错误 , 实际 上 这 个 错误 会 在 移入 
任何 新 的 输入 符号 之 前 就 被 发 现 。 

更 一 般 地 说 , 我 们 可 以 寻找 具有 相同 核心 (core) 的 LR(1) 项 集 ; 并 将 这 些 项 集合 并 为 一 个 项 集 。 
所 谓 项 集 的 核心 就 是 其 第 一 分 量 的 集合 。 比 如 在 图 4- 41 中 , 1, ALT, 就 是 这 样 一 对 项 集 ,它们 的 核 
心 是 {Cd +}. 类似 地 , h A Ig BA MAEM, 它们 的 核心 是 {Cxc C, C+ cC, 
C>- dj 另外 ,还 有 -一 对 项 集 k 入 ,它们 的 公共 核心 是 |C->cCi* |。 请 注意 , 一 般 而 言 ,一 个 核 
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心 就 是 当前 正 处 理 的 文法 的 LR (0) 项 集 , 一 个 LR(1) 文 法 可 能 产生 多 个 具有 相同 核心 的 项 集 。 

HH GOTO, X) 的 核心 只 由 工 的 核心 决定 ,一 组 被 合并 的 项 集 的 GOTO 目标 也 可 以 被 合并 。 
因此 , 当 我 们 合并 项 集 时 可 以 相应 地 修改 COTO 函数 。 动 作 函 数 也 需要 加 以 修改 , 以 反映 出 被 合 
并 的 所 有 项 集 的 非 报错 动作 。 | 

假设 我 们 有 一 个 LR(1) 文 法 , 也 就 是 说 ,这 个 文法 的 LR(1) 项 集 没有 产生 语法 分 析 动 作 冲 
突 。 如 果 我 们 将 所 有 具有 相同 核心 的 状态 替换 为 它们 的 并 集 , 那么 得 到 的 并 集 有 可 能 产生 冲突 。 
但 是 因为 下 面 的 原因 , 这 种 情况 不 大 可 能 发 生 : 假设 在 并 集中 有 一 个 项 [4 一 a， , a] 要求 按照 
Aoi FSA, 同时 另 一 个 项 [B35B* ay, 5] 要 求 进行 移入 , 那么 就 会 出 现在 向 前 看 符号 a。 上 的 
冲突 。 此 时 必然 存在 某 个 被 合并 进来 的 项 集中 包含 项 [4->a* , a] ,同时 因为 所 有 这 些 状态 的 核 
心 都 是 相同 的 , 所 以 这 个 被 合并 进来 的 项 集中 必然 还 包含 项 [ BB + ay, cl, 其 中 < 是 某 个 终结 
符号 。 如 果 这 样 的 话 , 这 个 状态 中 同样 也 有 在 输入 a 上 的 移入 / 归 约 冲突 , 因此 这 个 文法 不 是 我 
们 假设 的 LR(1) 文 法 。 因 此 , 合并 具有 相同 核心 的 状态 不 会 产生 出 原 有 状态 中 没有 出 现 的 移入 / 
归 约 冲突 , 因为 移入 动作 仅 由 核心 决定 , 不 考虑 向 前 看 符号 。 

然而 , 如 下 面 的 例子 所 示 , 合并 项 集 可 能 会 产生 归 约 / 归 约 冲突 。 


考虑 文法 

S'S 

SoaAd\|bBd\laBelbAe 

A>c 

B->c 

该 文法 产生 四 个 串 acd, ace, bed 和 bce。 读 者 可 以 构造 出 这 个 文法 的 LR(1) 项 集 , 以 验证 该 

文法 是 LR(1) 的 。 完 成 这 些 工作 之 后 , 我 们 发 现 项 集 |[4->c… , d], [Boe+ ,ej 省 是 可 行 前 缀 ac 
的 有 效 项 ,| [4 一 c* ,e], [Bc* ,dj]| 是 bc HARM, 这 两 个 项 集 都 没有 冲突 , 并 且 它们 的 核 
心 是 相同 的 。 然 而 , 它们 的 并 集 , BI 


A—yc* , d/e 

Bc: , d/e 
产生 了 一 个 归 约 / 归 约 冲突 ,因为 当 输 入 为 & 或 e 的 时 候 , 这 个 合并 项 集 既 要 求 按照 4=»e 进行 归 
约 , 又 要 求 按照 Boe 进行 归 约 。 O 


我 们 将 给 出 两 个 LALR 分 析 表 构造 算法 , 现在 来 介绍 其 中 的 第 一 个 。 这 个 算法 的 基本 思想 是 
构造 出 LR(1) 项 集 , 如 果 没 有 出 现 冲 突 , 就 将 具有 相同 核心 的 项 集合 并 。 然 后 我 们 根据 合并 后 得 
到 的 项 集 族 构造 语法 分 析 表 。 我 们 将 要 描述 的 方法 的 主要 用 途 是 定义 LRLA(1) 文 法 。 构 造 整 个 
LR(1) 项 集 族 需要 的 空间 和 时 间 太 多 , 因此 很 少 在 实践 中 使 用 。 

CREJ 一 个 简单 , 但 空间 需求 大 的 LALR 分 析 表 的 构造 方法 。 

输入 : 一 个 增 广 文法 G'。6 

输出 : 文法 6G' 的 LALR 语法 分 析 表 函数 ACTION 和 GOTO, 

方法 : 

1) 构造 LR(1) 项 集 族 C= fly, hy …, In} 

2) 对 于 LR(1) 项 集中 的 每 个 核心 , 找 出 所 有 具有 这 个 核心 的 项 集 , 并 将 这 些 项 集 痊 换 为 它 
们 的 并 集 。 

3) S= [Jo Jis …， 几 | 是 得 到 的 LR(1) 项 集 族 。 状 态 i 的 语法 分 析 动 作 是 按照 和 算法 
4. 56 中 的 方法 根据 /构造 得 到 的 。 如 果 存 在 一 个 分 析 动作 冲突 , 这 个 算法 就 不 能 生成 语法 分 析 
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器 , 这 个 文法 就 不 是 LALR(1) 的 。 

4) GOTO 表 的 构造 方法 如 下 。 如 果 是 一 个 或 多 个 LR(1) 项 集 的 并 集 , 也 就 是 说 了 = UL, 
ste 那么 GOTO(I,, X), GOTO(I,, X), =, COTO(L,, X) RIZO EHB, AHI, 

ils a E 令 玉 是 所 有 和 GOTO (1, X) 具有 相同 核心 的 项 集 的 并 集 ; ge 

a Wis 

算法 4.59 pee G 的 LALR 语法 分 析 表 。 如 果 没 有 语法 分 析 动作 冲突 ， 
定 的 文法 就 称 为 LALR(1) 文 法 。 在 第 (3) 步 中 构造 得 到 的 项 集 族 被 称 为 LALR(1) 项 集 族 。 
再 次 考虑 文法 (4. 55) 。 该 文法 的 COTO 图 已 经 显示 在 图 4- 41 中 。 我 们 前 面 提 到 过 ， 
有 三 对 可 以 合并 的 项 集 。 和 16 被 替换 为 它们 的 并 集 : 

le: C—>c > C, c/d/$ 


C— » cC, c/d/ $ 
C—> » d, c/d/ $ 
L F 被 替换 为 它们 的 并 集 : 
Iy: C>d + , c/d/ $ 
Ts 和 了 被 替换 为 它们 的 并 集 : 


Igo: C—cC + , c/d/ $ 

这 些 压 缩 过 的 项 集 的 LALR 动作 和 GOTO 函数 显示 在 图 4-43 中 。 

要 了 解 如 何 计算 GOTO RA, 考虑 COTO (Is, C)。 在 原来 的 LR(1) 项 集中 , GOTO(I,, C) 
=l, 而 现在 1 是 169 的 一 部 分 , 因此 我 们 令 COTO CH 一 ov 一 aon iS ae 
1s9。 如 果 我 们 考虑 Ig, BD 5 的 另 一 部 分 , 我们 仍然 可 以 得 到 
相同 的 结论 。 也 就 是 说 , GOTO , C) = 万 ,为 现在 是 189 的 一 
部 分 。 再 举 一 个 例子 。 考 虑 GOTO(1z; c), 即 在 状态 五 上 输 
人 为 c 时 执行 移入 之 后 的 状态 。 在 原来 的 LR(1) 项 集中 ,C0- 
TO\P,C) =16。 因 为 16 现在 是 136 的 一 部 分 , 所 以 GOTO( L, 
c) 变 成 了 136。 因 此 , 图 4-43 中 对 应 于 状态 2 和 输入 的 条 目 
被 设置 为 S 36, 表示 移 人 并 将 状态 36 压 人 栈 中 。 而 | 图 4-43 例子 4. 54 的 文法 

当 处 理 语言 ex de * d 中 的 一 个 串 时 , 图 4- 42 的 LR 语法 H LALKI 
分 析 器 和 图 4-43 的 LALR 语法 分 析 器 执行 完全 相同 的 移 人 和 
归 约 动作 序列 ,尽管 栈 中 状态 的 名 字 有 所 不 同 。 比 如 , 在 LR 语法 分 析 器 将 1, BR Ig 压 人 栈 中 时 ， 
LALR 语法 分 析 器 将 B6 压 人 栈 中 。 这 个 关系 对 于 所 有 的 LALR 文法 都 成 立 。 在 处 理 正确 的 输入 
时 ，LR 语法 分 析 器 和 LALR 语法 分 析 器 将 相互 模拟 。 

在 处 理 错误 的 输入 时 , LALR 语法 分 析 器 可 能 在 LR 语法 分 析 器 报错 之 后 继续 执行 三 些 归 约 
动作 。 然 而 , LALR 语法 分 析 器 决 不 会 在 LR 语法 分 析 器 报错 之 后 移 人 任何 符号 。 比 如 , 在 输入 
为 ccd 且 后 面 跟 有 $ 时 , 图 4-42 的 LR 语法 分 析 器 将 

0334 
FRAP, 并 且 在 状态 4 上 发 现 一 个 错误 ,因为 下 一 个 输入 符号 是 $ 而 状态 4 在 $ 上 的 动作 为 报 
错 。 相 应 地 ,图 4- 43 中 的 LALR 语法 分 析 器 将 执行 对 应 的 操作 ,将 
0 36 36 47 
压 人 栈 中 。 但 是 状态 47 在 输入 为 $ 时 的 动作 为 归 约 C-*d。 因 此 ,LALR 语法 分 析 器 将 把 栈 中 内 
容 改 为 
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0 36 36 89 
现在 ,状态 89 在 输入 $ 上 的 动作 为 归 约 C-*eC。 栈 中 内 容 变 为 
0 36 89 
此 时 仍 要 求 进行 一 个 类 似 的 归 约 ,得 到 栈 
02 
最 后 , 状态 2 在 输入 $ 上 的 动作 为 报错 , 因此 现在 发 现 了 这 个 错误 。 
4.7.5 高效 构造 LALR 语法 分 析 表 的 方法 
我 们 可 以 对 算法 4.59 进行 多 处 修改 , 使 得 在 创建 LALR(1 ) 语 法 分 析 表 的 过 程 中 不 需要 构造 
出 完整 的 规范 LR(1) 项 集 族 。 
。 首先 , 我 们 可 以 只 使 用 内 核 项 来 表示 任意 的 LR(0) 或 LR(1) 项 集 。 也 就 是 说 , 只 使 用 初始 
BLS’ 3] 或 [8 一 S, $ ] 以 及 那些 点 不 在 产生 式 体 左 端 的 项 来 表示 项 集 。 
© 我们 可 以 使 用 一 个 “传播 和 自发 生成 ”的 过 程 (我 们 稍 后 将 描述 这 个 方法 ) 来 生成 向 前 看 
符号 , 根据 LR(0) 项 的 内 核 生成 LALR(1) 项 的 内 核 。 
。 如 果 我 们 有 了 LALR(1 ) 内 核 , 我 们 可 以 使 用 图 4- 40 中 的 CLOSURE 函数 对 各 个 内 核 求 闭 
f, 然后 再 把 这 些 LALR(1 ) 项 集 当 作 规范 LRC) 项 集 族 , 使 用 算法 4. 56 来 计算 分 析 表 条 
E, 从 而 得 到 LALR(1 ) 语 法 分 析 表 。 
我 们 将 使 用 例子 4 48 中 的 非 SLR 多 法 作为 个 例子 ,说 明 高 效 的 LALR(1) 语 法 分 析 
E sie a 
S'S 
S-L=RIR 
L—*R | id 
RL 
这 个 文法 的 完整 LTR(0) 项 集 显示 在 图 4.39 中 。 这 些 项 集 的 内 核 显示 在 图 4- 44 中 。 o 
现在 我 们 必须 给 这 些 用 内 核 表示 的 
LR(0) 项 加 上 正确 的 向 前 看 符号 ,创建 出 
LALR(1) 项 集 的 内 核 。 在 两 种 情况 下 , 向 
前 看 符号 b 可 以 添加 到 某 个 LALR(1) 项 集 
J 中 的 LR(0) 项 By .6 之 上 : 
1) 存在 一 个 包含 内 核 项 [Aa B, 
al HMRI, 并且 J= GOTO(7, X)。 不 管 a 
为 何 值 , 在 按照 图 4- 40 的 算法 构造 
GOTO( CLOSURE( {[A—a +B, a]l}, X) 图 4-44 文法 (4.49) 的 LR(0) 项 集 的 内 核 
时 得 到 的 结果 中 总 是 包含 [ ->y ô, 5]。 对 于 Boy "5 而 言 , 这 个 向 前 看 符号 5 被 称 为 自发 生 
成 的 。 作 为 一 个 特殊 情况 ,向 前 看 符号 $ 对 于 初始 项 集中 的 项 [5'、 + 5] 而 言 是 自发 生成 的 。 
2) 其 余 条 件 和 (1) 相 同 , [B a=b, 且 按 照 图 4-40 所 示 计 算 GOTO( CLOSURE( | [A>a . B, 
5]1 ) , X) 得 到 的 结果 中 包含 [ By +5, 6] 的 原因 是 项 4-wa* B 有 一 个 向 前 看 符号 5。 在 这 种 情 
况 下 , 我们 说 向 前 看 符号 从 7 的 内 核 中 的 Aa : B 传播 到 了 J 的 内 核 中 的 By . 8 上。 请 注意 ， 
传播 关系 并 不 取决 于 某 个 特定 的 向 前 看 符号 , 要 么 所 有 的 向 前 看 符号 都 从 一 个 项 传播 到 男 一 个 
项 , 要 么 都 不 传播 。 
我 们 需要 确定 每 个 LR(0) 项 集中 自发 生成 的 向 前 看 符号 , 同时 也 要 确定 向 前 看 符号 从 哪些 
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项 传播 到 了 哪些 项 。 这 个 检测 实际 上 相当 简单 。 令 # 为 一 个 不 在 当前 文法 中 的 符号 。 令 Ave p 
为 项 集 7 中 的 一 个 内 核 LR(0) 项 。 对 每 个 于 计算 J =GOTO(CLOSURE( | [A—a + B, #]}), X)。 
对 于 了 中 的 每 个 内 核 项 , 我 们 检查 它 的 向 前 看 符号 集合 。 如 果 # 是 它 的 向 前 看 符号 , 那么 向 前 看 
符号 就 从 4-_va +B 传播 到 了 这 个 项 。 所 有 其 他 的 向 前 看 符号 都 是 自发 生成 的 。 这 个 思想 在 下 面 
的 算法 中 被 精确 地 表达 了 出 来 。 这 个 算法 还 用 到 了 一 个 性 质 : J 中 的 所 有 内 核 项 中 点 的 左边 都 是 
X, 也 就 是 说 , 它们 必然 是 形 如 ByX - 6 的 项 。 
确定 向 前 看 符号 。 

输入 : 一 个 LR(0) 项 集 1 的 内 核 X 以 及 一 个 文法 符号 X。 

输出 : 由 7 中 的 项 为 GCOTO(7, X) 中 内 核 项 自发 生成 的 向 前 看 符号 , 以 及 7 中 将 其 向 前 看 符号 
传播 到 COTO(T, X) 中 内 核 项 的 项 。 

方法 : 算法 在 图 4-45 中 给 出 。 c 


for ( KK 中 的 每 个 项 A > aß) { 
J := CLOSURE({[A > aB,#}]} ); 
半 ([B 一 YX6,aj] 在 J 中 ,并且 a FETH ) 
断定 GOTO(I, 义 ) 中 的 项 B > yX-6 的 向 前 看 符号 4 
是 自发 生成 的 ; 


if ( [B > 7-X6, #] 在 J 中 ) 
断定 向 前 看 符号 从 了 中 的 项 4 一 .8 传播 到 了 Gorol, X) 中 的 项 
ByX6 之 上 ; 





图 4-45 发 现 传 播 的 和 自发 生成 的 向 前 看 符号 


现在 我 们 可 以 把 向 前 看 符号 附加 到 LR(0) 项 集 的 内 核 上 , 从 而 得 到 LALR(1) 项 集 。 首 先 ， 
我 们 知道 $ 是 初始 LR(0) 项 集中 的 S>- S 的 向 前 看 符号 。 算 法 4. 62 给 出 了 所 有 自发 生成 的 向 
前 看 符号 。 将 所 有 这 些 向 前 看 符号 列 出 之 后 , 我 们 必须 让 它们 不 断 传播 , 直到 不 能 继续 传播 为 
止 。 有 很 多 方法 可 以 实现 这 个 传播 过 程 。 从 某 种 意义 上 说 ， 所 有 这 些 方法 都 跟踪 已 经 传播 到 某 
个 项 但 是 尚未 传播 出 去 的 “新 ”向 前 看 符号 。 下 面 的 算法 描述 了 一 个 将 向 前 看 符号 传播 到 所 有 
项 中 的 技术 。 

LALR(1) 项 集 族 的 内 核 的 高 效 计算 方法 。 

输入 : 一 个 增 广 文法 C'e 

输出 : 文法 C' 的 LALR(1) 项 集 族 的 内 核 。 

方法 : 

1) 构造 6 的 LR(0) 项 集 族 的 内 核 。 如 果 空间 资源 不 紧张 ,最 简单 的 方法 是 像 4. 6. 2 节 那 样 
构造 LR(0) 项 集 ,然后 再 删除 其 中 的 非 内 核 项 。 如 果 内 存 空间 非常 紧张 , 我 们 可 以 只 保存 各 个 项 
集 的 内 核 项 , 并 在 计算 一 个 项 集 了 的 GOTO 之 前 先 计算 7 的 闭 包 。 

2) 将 算法 4.62 应 用 于 每 个 LR(0) 项 集 的 内 核 和 每 个 文法 符号 X, 确定 COTO(7, X) 中 各 内 
核 项 的 哪些 向 前 看 符号 是 自发 生成 的 , 并 确定 向 前 看 符号 从 了 中 的 哪个 项 被 传播 到 GOTO(T, X) 
中 的 内 核 项 上 。 

3) 初始 化 一 个 表格 , 表 中 给 出 了 每 个 项 集中 的 每 个 内 核 项 相关 的 向 前 看 符号 。 最 初 , 每 个 项 
的 向 前 看 符号 只 包括 那些 被 我 们 在 步 又 (2) 中 确定 为 自发 生成 的 符号 。 

4) 不 断 扫描 所 有 项 集 的 内 核 项 。 当 我 们 访问 一 个 项 i 时 , 使 用 步 又 (2) 中 得 到 的 、 用 表格 表 
示 的 信息 , 确定 i 将 它 的 向 前 看 符号 传播 到 了 哪些 内 核 项 中 。 项 i 的 当前 向 前 看 符号 集合 被 加 到 
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和 这 些 被 传播 的 内 核 项 相关 联 的 向 前 看 符号 集合 中 。 我 们 继续 在 内 核 项 上 进行 扫描 ， 直到 没有 
新 的 向 前 看 符号 被 传播 为 止 。 口 
EETA RHUF A. 61 的 文法 构造 LALR(1) 项 集 的 内 核 。 这 个 文法 的 LR(0) 项 集 的 内 核 如 
图 4- 44 所 示 。 当 我 们 将 算法 4. 62 应 用 于 项 集 o 的 内 核 时 , 我 们 首先 计算 CLOSURE (1 人 [LS 一 
IS, #)}), Ep 


S'— - S, # L=- *R, #/= 
S= L= RY L> id, #/ = 
S>-R, # R=. L, # 


在 这 个 闭 包 的 项 中 , 我 们 看 到 两 个 项 中 的 向 前 看 符号 = 是 自发 生成 的 。 第 一 个 项 是 L->* * Re 
这 个 项 中 点 的 右边 是 *, 它 生成 了 [LS* “R=]。 也 就 是 说 ,= 是 有 4 路 >*“ RR 的 自发 生成 的 
向 前 看 符号 。 类 似 地 , [L> id, = MERN =Æ P iid 的 自发 生成 的 向 前 看 符号 。 

因为 # 是 这 个 闭 包 中 六 个 项 的 向 前 看 符号 , 所 以 我 们 确定 10 PRIS’ + 5 将 它 的 向 前 看 符 


号 传播 到 下 面 的 六 个 项 中 : 
NPR S'S. L PH L> +R 
l, 中 的 S>L- =R 1; 中 的 Lid - 
1, PRI SOR - 1, PAY ROL - 


在 图 4-47 中 , 我 们 说 明了 算法 4. 63 的 步骤 (3) 和 (4) 。 标 号 为 INIT 的 列 给 出 了 各 个 内 核 项 
的 自发 生成 的 向 前 看 符号 。 这 些 符 号 中 只 包括 前 面 讨论 过 的 = 的 两 次 出 现 ,以 及 初始 项 一 5$ 
的 自发 生成 的 向 前 看 符号 $ 。 

在 第 一 趟 扫描 中 , 向 前 看 符号 $ 从 16 中 的 5'=>…5 传播 到 图 4-46 中 列 出 的 六 个 项 上 。 向 前 
看 符号 = 从 六 PH L>» + RARE PALS * R > 和 1s PA ROL* 上。 它 还 传递 到 它 自身 
以 及 Ph Loide 上 ,但 是 这 些 向 前 看 符号 本 来 就 已 经 存在 了 。 在 第 二 和 第 三 趟 扫描 时 ,唯一 
被 传播 的 新 向 前 看 符号 是 $, 它 在 第 二 趟 扫描 时 被 传播 到 n 和 4 的 后 继 中 , 并 在 第 三 趟 扫描 时 
到 达 有 的 后 继 中 。 在 第 四 趟 扫描 时 没有 新 的 向 前 看 符号 被 传播 , 因此 最 终 的 向 前 看 符号 集合 如 
图 4-47 最 右边 的 列 所 示 。 









































向 前 看 符号 
oa | a | SSH 
$ $ 
$ $ 
$ $ 
$ $ 
$ $ 
=/$ | =/8 
=/$ =/$ 
$ 





























图 4-46 向 前 看 符号 的 传播 图 4-47 向 前 看 符号 的 计算 
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请 注意 ,在 例 4.48 中 , 使 用 SLR 方法 时 发 现 的 移 人 / 归 约 冲突 在 使 用 LALR 技术 时 消失 了 。 
BAL 中 的 SL .=RR 生 成 了 在 输入 = 上 的 移 和 人 动作, BÆ h 中 R- 江 :的 向 前 看 符号 只 包括 
$ ,因此 两 者 之 间 不 再 有 冲突 。 o 
4.7.6 LR 语法 分 析 表 的 压缩 

一 个 典型 的 具有 50 ~ 100 个 终结 符号 和 100 个 产生 式 的 程序 设计 语言 文法 的 LALR 语法 分 析 
表 中 可 能 包含 几 百 个 状态 。 分 析 表 的 动作 函数 常常 包含 20000 多 个 条 目 , 每 个 条 目 至 少 需 要 8 个 
二 进 制 位 进行 编码 。 对 于 小 型 设备 , 有 一 个 比 二 维 数组 更 加 高 效 的 编码 方法 是 很 重要 的 。 我 们 
将 简短 地 描述 一 些 可 以 用 于 压缩 LR 语法 分 析 表 中 的 ACTION 字段 和 GOTO 字段 的 技术 。 

一 个 可 用 于 压缩 动作 字段 的 技术 所 基于 的 原理 是 动作 表 中 通常 有 很 多 相同 的 行 。 比 如 ,图 
4.42 中 的 状态 0 和 3 就 有 相同 的 动作 条 目 ,状态 2 和 6 也 是 这 样 。 因 此 ,如 果 我 们 为 每 个 状态 创建 
一 个 指向 一 维 数组 的 指针 ,我 们 就 可 以 节省 可 观 的 空间 , 而 付出 的 时 间 代 价 却 很 小 。 具 有 相同 动 
作 的 状态 的 指针 指向 相同 的 位 置 。 为 了 从 这 个 数组 获取 信息 ,我 们 给 各 个 终结 符号 赋予 一 个 纺 
号 ,编号 范围 为 从 零 开始 到 终结 符号 总 数 减 一 。 对 于 每 个 状态 , 这 个 整数 编号 将 作为 从 指针 值 开 
始 的 偏 移 量 。 在 一 个 给 定 的 状态 中 , 第 i 个 终结 符号 对 应 的 语法 分 析 动 作 可 以 在 该 状态 的 指针 值 
之 后 的 第 i 个 位 置 上 找到 。 

如 果 为 每 个 状态 创建 一 个 动作 列表 , 我 们 可 以 获得 更 高 的 空间 效率 , 但 语法 分 析 器 会 变 慢 。 
这 个 列表 由 (终结 符号 , 动作 ) 对 组 成 。 一 个 状态 的 最 频繁 的 动作 可 以 放 在 列表 的 结尾 处 , 并 且 
我 们 可 以 在 这 个 对 中 原本 放 终 结 符号 的 地 方 放 上 符号 “any”, 表示 如 果 没 有 在 列表 中 找到 当前 
输入 , 那么 不 管 这 个 输入 是 什么 , 我 们 都 选择 这 个 动作 。 不 仅 如 此 , 为 了 使 得 一 行 中 的 内 容 更 加 
一 致 , 我 们 可 以 把 报错 条 目 安全 地 替换 为 规约 动作 。 对 错误 的 检测 会 稍 有 延 后 , 但 仍 可 以 在 执行 
下 一 个 移 人 动作 之 前 发 现 错误 。 

DAJ 考 虑 图 437 的 语法 分 析 表 。 首 先 ,请 注意 状态 0、4、6 和 7 的 动作 是 相同 的 。 我 们 可 
以 用 下 面 的 列表 来 表示 它们 : 
符号 动作 


状态 1 有 一 个 类 似 的 列表 : 


any error 
在 状态 2 中 , 我 们 可 以 把 报错 条 目 蔡 换 为 忆 , 因此 对 于 除 * 之 外 的 输入 都 按照 产生 式 2 进行 
归 约 。 因 此 状态 2 的 列表 是 
* s7 
any 12 
状态 3 只 有 报错 和 至 条 目 。 我 们 可 以 把 前 者 替换 为 后 者 ,因此 状态 3 的 列表 只 有 一 个 对 
(any, 14), RÆ 5., 10 和 11 也 可 以 做 类 似 处 理 。 状 态 8 的 列表 是 
+ s6 
} sll 


any error 
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而 状态 9 的 列表 是 
间 sf 口 
any rl 
我 们 也 可 以 把 GOTO 表 编 码 为 一 个 列表 , 但 这 里 更 加 高 效 的 方法 是 为 每 个 非 终结 符号 4 构造 
一 个 数 对 的 列表 。4 的 列表 中 的 每 个 对 形 如 ( 当前 状态 , 下 一 状态 ), 表示 
GOTO[ 当前 状态 , A] = 下 一 状态 
这 个 技术 很 有 用 , 因为 COTO 表 的 一 列 中 常常 只 有 很 少 几 个 状态 。 原 因 是 对 于 某 个 非 终结 符 
号 4 上 的 COTO 目标 状态 的 项 集中 必然 存在 某 些 项 ,这些 项 中 4 紧 靠 在 点 的 左边 。 对 于 任意 两 个 
不 同 的 文法 符号 XX、Y, 没有 哪个 GOTO 目标 项 集 既 有 点 左边 为 X 的 项 , 又 有 点 左边 为 了 的 项 。 因 
此 , 每 个 状态 最 多 只 出 现在 COTO 表 的 一 列 中 。 
为 了 进一步 减少 使 用 的 空间 , 我 们 注意 到 COTO 表 中 的 报错 条 目 从 来 都 不 会 被 查询 到 。 因 
此 ,我 们 可 以 把 每 个 报错 条 目 替 换 为 该 列 中 最 常用 的 非 报错 条 目 。 这 个 条 目 变 成 了 默认 选择 。 在 
每 一 列 的 列表 中 , 它 被 表示 为 一 个 “当前 状态 ”字段 为 any 的 对 。 
[了 和 再 次 考虑 图 437。 广 对 应 的 列 中 与 状态 7 对 应 的 条 目 是 10， 所 有 其 他 的 条 目 所 对 应 
的 要 么 是 3 要 么 报错 。 我 们 可 以 用 3 来 替换 报错 条 目 , 为 F 列 创建 列表 
SHIRA ,下 一 状态 
3 10 
any 3 
类 似 地 , T 列 的 列表 可 以 是 
6) 9 
any 2 
对 于 五 列 , 我 们 可 以 选择 1 或 8 作为 默认 选择 。 这 两 种 选择 都 需要 两 个 列表 条 目 。 比 如 , 我 
们 可 以 为 E 列 创建 如 下 列表 
4 8 
any 1 g 
这 些小 例子 中 体现 出 来 的 空间 节省 效果 可 能 具有 误导 性 。 因 为 在 这 个 例子 和 前 一 个 例子 中 
创建 的 列表 中 的 条 目 数量 , 再 加 上 从 状态 到 动作 列表 的 指针 以 及 从 非 终 结 符号 到 后 继 状态 表 的 
指针 , 它们 需要 的 空间 和 图 4-37 中 的 和 抢 阵 实现 方法 相 比 , 并 没有 令 人 印象 深刻 的 空间 节省 效果 。 
但 是 对 于 现实 中 的 文法 , 列表 表示 法 所 需要 的 空间 通常 比 矩 阵 表 示 法 所 需 空 间 少 10% 。 在 3.9.8 
节 中 讨论 的 用 于 有 穷 自动 机 的 表 压 缩 方法 也 可 以 用 来 表示 LR 语法 分 析 表 。 
4.7.7 4.7 节 的 练习 
练习 4. 7. 1: 为 练习 4.2.1 HLE S—>SS + ISS la 构造 
1) 规范 LR 项 集 族 。 
2) LALR 项 集 族 。 
练习 4. 7.2: 对 练习 4.2.2(1) ~ (7) 的 各 个 ( 增 广 ) 文 法 重复 练习 4.7.1. 
! 练习 4.7.3: 对 练习 4.7.1 的 文法 , 使 用 算法 4. 63, 根据 该 文法 的 LR(0) 项 集 的 内 核 构 造 
HE RY LALR 项 集 族 。 
! 练习 4.7.4: 说 明 下 面 的 文法 
S—AalbAcldclbda 
Ad 
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是 LALR(1) 的 , 但 不 是 SLR(1) 的 。 
! 练习 4.7.5: 说 明 下 面 的 文法 
So-AalbAcIBc|lbBa 
A—rd 
Bod 
是 LR(1) 的 , 但 不 是 LALR(1) 的 。 


4.8 使 用 二 义 性 文法 


实际 上 ,每 个 二 义 性 文法 都 不 是 LR 的 , 因此 它们 不 在 前 面 两 节 讨论 的 任何 文法 类 之 内 。 然 
Ti, 某 些 类 型 的 二 义 性 文法 在 语言 的 规约 和 实现 中 很 有 用 。 对 于 像 表达 式 这 样 的 语言 构造 , 二 义 
性 文法 能 提供 比 任何 等 价 的 无 二 义 性 文法 更 短 、 更 自然 的 规约 。 二 义 性 文法 的 另 一 个 用 途 是 隔 
离 经 常 出 现 的 语法 构造 , 以 对 其 进行 特殊 的 优化 。 使 用 二 义 性 文法 , 我 们 可 以 向 文法 中 精心 加 入 
新 的 产生 式 来 描述 特殊 情况 的 构造 。 

虽然 使 用 的 文法 是 二 义 性 的 , 但 我 们 在 所 有 的 情况 下 都 会 给 出 消除 二 义 性 的 规则 , 使 得 每 个 
句子 只 有 一 棵 语法 分 析 树 。 通 过 这 个 方法 , 语言 的 规约 在 整体 上 是 无 二 义 性 的 ， 有 时 还 可 以 构造 
出 遵循 这 个 二 义 性 解决 方法 的 LR 语法 分 析 器 。 我 们 强调 应 该 保守 地 使 用 二 义 性 构造 , 并 且 必 须 
在 严格 控制 之 下 使 用 , 否则 无 法 保证 一 个 语法 分 析 器 识别 的 到 底 是 什么 样 的 语言 。 

4. 8. 1 用 优先 级 和 结合 性 解决 冲突 

考虑 带 有 运算 符 + 和 * 的 有 二 义 性 的 表达 式 文法 (4.3)。 为 方便 起 见 , 这 里 再 次 给 出 此 

文法 : 

E>E +E\|E* E|\(E) | id 

这 个 文法 是 二 义 性 的 , 因为 它 没有 指明 运算 符 + 和 * 的 优先 级 和 结合 性 。 无 二 义 性 的 文法 (4. 1) ( 包 
含 产生 式 EOE + TAT OT * 下 ) 生 成 同样 的 语言 , 但 是 指定 + 的 优先 级 低 于 *, 并且 两 个 运算 符 
都 是 左 结合 的 。 出 于 两 个 原因 ,我 们 愿意 使 用 
这 个 二 义 性 文法 。 第 一 , 我 们 将 会 看 到 的 , 可 
以 很 容易 地 改变 运算 符 + 和 * 的 优先 级 和 结 
合 性 , 既 不 需要 修改 文法 (4.3) 的 产生 式 , 也 
不 需要 改变 相应 语法 分 析 器 的 状态 数目 。 第 
二 , 相应 无 二 义 性 文法 的 语法 分 析 器 将 把 部 分 
时 间 用 于 归 约 产生 式 ET ATF, BI 
产生 式 的 功能 就 是 保证 结合 性 和 优先 级 。 二 
义 性 文法 (4.3) 的 语法 分 析 器 不 会 把 时 间 浪 费 
在 对 这 些 单产 生 式 ( 即 产生 式 体 中 只 包含 一 个 
非 终结 符号 的 产生 式 ) 的 归 约 上 。 

使 用 五 一 五 增 广 之 后 的 二 义 性 表达 式 文 
法 (4.3) 的 LR(0) 项 集 显 示 在 图 4-48 中 。 因 
为 文法 (4.3) 是 二 义 性 的 , 在 我 们 试图 用 这 些 
项 集 生成 一 个 LR 语法 分 析 表 时 会 出 现 分 析 动 
作 冲 突 。 对 应 于 项 集 Ty 和 五 的 两 个 状态 就 产 
生 了 这 样 的 冲突 。 假 设 我 们 使 用 SLR 方法 来 ” ” 图 4 48 一 个 增 广 表 达 式 文法 的 LR(0) 项 集 
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PHA SER o 17 在 输入 + 或 * 上 产生 了 冲突 , 不 能 确定 应 该 按照 EE +E 归 约 还 是 应 该 
移入 。 这 个 冲突 无 法 解决 , 因为 + 和 * 都 在 FOLLOW( 五 ) 中 。 因 此 在 输入 为 * 或 + 时 , 这 两 种 动作 
都 被 要 求 执 行 。1s 也 产生 了 类 似 的 冲突 , 即 在 输入 为 + 或 * 时 , 不 能 确定 应 该 按照 EE * E 归 约 还 
是 应 该 移入 。 实 际 上 , 任意 一 种 LR 语法 分 析 表 构造 方法 都 会 产生 这 样 的 冲突 。 

然而 , 这 些 问题 可 以 使 用 + 和 * 的 优先 级 和 结合 性 信息 来 解决 。 考 虑 输入 id + id * id, È 
使 得 基于 图 4- 48 的 语法 分 析 器 在 处 理 完 id + id 之 后 进入 状态 7。 更 明确 地 说 , 语法 分 析 器 进入 
如 下 的 格局 : 


前 级 栈 输入 
E+E C147 «ia s 


为 方便 起 见 , 我 们 同时 将 对 应 于 状态 1、4 和 7 的 符号 显示 在 “前 缀 ” 列 中 。 

MR * 的 优先 级 高 于 +, 我 们 知道 语法 分 析 器 应 该 将 * 移 人 栈 中 , 准备 将 这 个 * 和 它 两 边 的 
id 符号 归 约 为 一 个 表达 式 。 图 4-37 显示 了 根据 等 价 的 无 二 义 性 文法 得 到 的 SLR 语法 分 析 器 。 这 
个 分 析 器 也 做 出 同样 的 选择 。 另 一 方面 , 如 果 + 的 优先 级 高 于 * , 我 们 知道 语法 分 析 器 应 该 将 
E+ EHAN E, RIE, + 和 * 之 间 的 相对 优先 关系 可 以 被 用 于 解决 状态 7 上 的 冲突 , 确定 在 输入 

* 上 应 该 按照 ->E +E 归 约 还 是 应 该 移 人 人。 

假如 输入 是 i + id +i ,语法 分 析 器 在 处 理 了 输入 ia + id 之 后 , 仍然 能 获得 栈 内 容 为 
0147 的 格局 。 在 输入 为 + 时 ,状态 7 中 仍然 有 一 个 移入 / 归 约 冲突 。 然 而 , 现在 运算 符 + 的 结 
合 性 可 以 决定 如 何 解决 这 个 冲突 。 如 果 + 是 左 结 合 的 , 正确 的 动作 是 按照 EE +E 进行 归 约 。 
也 就 是 说 , 第 一 个 + 号 两 边 的 id 必须 被 分 在 一 组 。 这 个 选择 仍然 和 相应 无 二 义 性 文法 的 SLR 语 
法 分 析 器 的 做 法 一 致 。 

概括 地 讲 ， 假 设 + 是 左 结合 的 , 状态 7 在 输入 + 时 的 动作 应 该 是 按照 Bk +E 进行 归 约 。 假 
设 * 的 优先 级 高 于 + , 状态 7 在 输入 * 上 的 动作 应 该 是 移 和 人 人。 类似 地 , 假设 * 是 左 结合 的 , 并且 
它 的 优先 级 高 于 + 。 因 为 只 有 当 栈 中 最 上 端的 三 个 
符号 是 五 * 五 时 ， 状 态 8 才能 出 现在 栈 顶 。 我 们 可 以 
认为 状态 8 在 输入 * 和 + 上 的 动作 都 是 按照 E>E * 
EAA. 对 于 输入 为 + 的 情况 , 理由 是 * 的 优先 级 高 
于 +; 而 对 于 输入 为 * 的 情况 , 理由 是 * 是 左 结 
合 的 。 

按照 这 个 方式 进行 处 理 , 我 们 可 以 得 到 图 4- 49 
所 示 的 LR 语法 分 析 表 。 产 生 式 1 ~4 分 别 是 
E>E +E, E>E*E, E>( E ) 和 Eid, 很 有 意思 
的 是 , 如 果 从 图 4-37 所 示 的 无 二 义 性 表达 式 文法 : 
(4. 1) i SLR 分 析 表 中 删除 单产 生 式 Bor Top EA 文法 (4.3) 的 语法 分 析 表 
的 归 约 动作 , 我们 可 以 得 到 一 个 相似 的 语法 动作 表 。 在 使 用 LALR 和 规范 LR 语法 分 析 技 术 时 ， 
我 们 也 可 以 使 用 类 似 的 方法 来 处 理 这 种 二 义 性 文法 。 
4.8.2 “#s-else” AVI Wt 

再 次 考虑 下 面 的 条 件 语句 文法 : 


stmt 一 > 证 expr then stmt else stmt 












ACTION 


= 
et 
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| if expr then stmt 
| other 
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如 我 们 在 4. 3.2 节 中 指出 的 ,这 个 文法 是 三 义 性 的 ,因为 它 没有 解决 悬空 :else HY = HE TA) 
题 。 为 了 简化 这 个 讨论 , 我 们 考虑 这 个 文法 的 二 个 抽象 表示 , 其 中 i 表示 if expr then, e 表示 else, 
a 表示 “所 有 其 他 的 产生 式 ”。 那 么 我 可 以 用 增 广 产 生 式 S >S 重 写 这 个 文法 : 


SSS 


SoiSeSliSla (4. 67) 
文法 (4. 67) HY LR (0) 项 集 显示 在 图 4-50 中 。 因 为 文法 (4.67) 的 二 义 性 ， E I, "PA 


移 人 / 归 约 冲突 。 在 该 项 集中 ，$ 一 好 ，eS BR 
He BA, 又 因为 FOLLOW(S) ={e, $}, HS 
iS + 要 求 在 输入 为 e 的 时 候 用 SiS 进行 
归 约 。 
把 这 些 讨论 翻译 回 if-then-else 的 术语 , 假 
设 栈 中 内 容 为 

Fe if expr then stmt 


且 else 是 第 一 个 输入 符号 , 我 们 应 该 将 else 


SS 

S 一 iSeS 
9 iS 
Sa 


S'S. 


9 一 人 9e9 
9 一 29 

S + iSeS 
SiS 
Sa 





移入 栈 中 ( 即 移 入 e) 呢 ? 还 是 应 该 将 if expr 
then stmt 归 约 ( 即 按照 Sis 1924) we? 答案 图 4-50。 增 广 文法 (4.67) 的 LR(0) 状 态 
是 我 们 应 该 移 人 else, 因为 它 是 和 前 二 个 then“ 相 关 ” 的 。 按照 文法 (4.67) 的 术语 , 输入 中 
代表 else 的 e。 只 能 作为 以 站 开头 的 产生 式 体 的 一 部分， 而 现在 栈 顶 内 容 就 是 iS WERA 
HIRE e 后 面 的 符号 不 能 被 归 约 为 $， 使 得 分 析 器 无 法 归 约 得 到 完整 的 产生 式 体 iSes， 那么 
可 以 证 明 别 的 语法 分 析 过 程 也 不 可 能 得 到 这 个 产生 式 体 。 

我 们 可 以 确定 在 解决 五 中 的 移入 / 归 约 冲突 时 应 该 在 输入 为 e 时 执行 移入 动作 。 使 用 这 个 方 
式 解 决 了 4 在 输入 。 上 的 语法 分 析 动 作 冲 突 之 后 ,根据 图 4-50 的 项 集 构造 得 到 的 SLR 语法 分 析 
表 显示 在 图 4-51 H, 产生 式 1~3 分 别 是 8S_wiSeS、S_yiS M Sba. 

比如 ,在 处 理 输 入 iiaea 时 , 根据 正确 的 “悬空 -else” 冲突 的 解决 方法 , 语法 分 析 器 执行 了 图 
4-52 中 所 示 的 步骤 。 在 第 5 7, 状态 4 在 输入 上 选择 了 移入 动作 ; 而 在 第 9 行 , 状态 4 在 输 
A $ EERE Sis 进行 归 约 。 

















ACTION 
i). e 












移入 
根据 S > alat 
移入 
移入 


根据 9 > aty 
HUES > iSeS 归 约 
根据 S > 1S ie) 
接受 











图 4-51 A else 文法 的 LR 分 析 表 图 4-52 ”处 理 输 大 iiaea 时 的 语法 分 析 动作 


我 们 做 一 个 比较 ,如 果 我 们 不 能 使 用 二 义 性 文法 来 描述 条 件 语句 ， 那么 我 们 将 不 得 不 使 用 例 
4. 16 中 给 出 的 笨拙 的 文法 来 描述 。 
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4.8.3 ”LR 语法 分 析 中 的 错误 恢复 

当 LR 语法 分 析 器 在 查询 语法 分 析 动 作 表 并 发 现 一 个 报错 条 目 时 , 它 就 检测 到 了 一 个 语法 错 
误 。 在 查询 COTO 表 时 不 会 发 现 语法 错误 。 如 果 当 前 已 扫描 的 输入 部 分 不 可 能 存在 正确 的 后 续 
符号 串 , LR 语法 分 析 器 就 会 立刻 报错 。 规 范 LR 语法 分 析 器 不 会 做 任何 多 余 的 归 约 动作 ， 会 立刻 
报告 错误 。SLR 和 LALR 语法 分 析 器 可 能 会 在 报错 之 前 执行 几 次 归 约 动作 , 但 是 它们 决 不 会 把 一 
个 错误 的 输入 符号 移 人 到 栈 中 。 

在 LR 语法 分 析 过 程 中 , 我 们 可 以 按照 如 下 方式 实现 恐慌 模式 的 错误 恢复 策略 。 我们 从 栈 顶 
向 下 扫描 , 直到 发 现 某 个 状态 s, 它 有 二 个 对 应 于 某 个 非 终结 符号 4 的 COTO 目标 。 然 后 我 们 丢 
弃 零 个 或 多 个 输入 符号 , 直到 发 现 一 个 可 能 合法 地 跟 在 4 之 后 的 符号 & 为 止 。 之 后 语法 分 析 器 将 
GOTO(s, 4) 压 人 栈 中 , 继续 进行 正常 的 语法 分 析 。 在 实践 中 可 能 会 选择 多 个 这 样 的 非 终结 符号 
A, 通常 这 些 非 终结 符号 代表 了 主要 的 程序 段 ， 比 如 表达 式 、 语 句 或 块 。 比 如 ， 如果 4 是 非 终结 
符号 stmt, a 就 可 能 是 分 号 或 者 | 。 其 中 ,| 标记 了 一 个 语句 序列 的 结束 。 

这 个 错误 恢复 方法 试图 消除 包含 语法 错误 的 短语 。 语 法 分 析 器 确定 一 个 从 4 推导 出 的 串 中 
包含 错误 。 这 个 串 的 一 部 分 已 经 被 处 理 , 并 形成 了 栈 顶 部 的 一 个 状态 序列 。 这 个 串 的 其 余部 分 
还 在 输入 中 , 语法 分 析 器 则 在 输入 中 查找 可 以 合法 地 跟 在 4 后 面 的 符号 ,从 而 试图 跳 过 这 个 串 的 
其 余部 分 。 通 过 从 栈 中 删除 状态 ， 跳 过 一 部 分 输入 , 并 将 COTO(s, 4) 压 人 栈 中 , 语法 分 析 器 假 
装 它 已 经 找到 了 4 的 一 个 实例 , 并 继续 进行 正常 的 语法 分 析 。 

实现 短语 层次 错误 恢复 的 方法 如 下 :检查 LR 语法 分 析 表 中 的 每 个 报错 条 目 , 并 根据 语 
言 的 使 用 方法 来 决定 程序 员 所 犯 的 何 种 错误 最 有 可 能 引起 这 个 语法 错误 。 然 后 构造 出 适当 
的 恢复 过 程 , 通常 会 根据 各 个 报错 条 目 来 确定 适当 的 修改 方法 ,修改 栈 顶 状态 和 /或 第 一 个 
输入 符号 。 

在 为 一 个 LR 语法 分 析 器 设计 专门 的 错误 处 理 例 程 时 , 我 们 可 以 在 表 的 动作 字段 的 每 个 空 条 
目 中 填写 一 个 指向 错误 处 理 例 程 的 指针 。 该 例 程 将 执行 编译 器 设计 者 所 选 定 的 恢复 动作 。 这 些 
动作 包括 在 栈 和 /或 输入 中 删除 或 插入 符号 , 也 包含 蔡 换 输入 符号 或 将 输入 符号 换 位 。 我 们 必须 
并 慎 地 做 出 选择 ;避免 LR 语法 分 析 器 陷入 无 限 循环 。 一 个 安全 的 策略 是 保证 最 终 至 少 有 一 个 输 
入 符号 被 删除 或 移入 ,并 且 如 果 到 达 输 入 结束 位 置 时 要 保证 栈 会 缩小 。 应 该 避免 从 栈 中 弹出 一 
个 和 某 非 终结 符号 对 应 的 状态 , 因为 这 样 的 修改 相当 于 从 栈 中 消除 了 一 个 已 经 被 成 功 分 析 的 语 
言 构 造 。 

再 次 考虑 表达 式 文法 ACTION 
ERI EVE * £1 ( 8) Lia a 

图 4-49 中 显示 了 这 个 文法 的 LR 分 析 表 。 图 
4-53 中 显示 的 是 对 这 个 分 析 表 进行 修改 后 得 到 的 语 
法 分 析 表 。 修 改 后 的 表 添 加 了 错误 检测 和 恢复 的 动 
作 。 对 于 那些 在 某 些 输入 上 执行 特定 归 约 动作 的 状 
AS, 我 们 将 这 个 状态 中 的 报错 条 目 蔡 换 为 这 个 归 约 
动作 。 这 种 修改 可 能 会 使 得 报错 延 后 至 一 次 或 多 次 
归 约 动作 之 后 , 但 是 错误 仍然 会 在 任何 移入 动作 发 
生 之 前 被 发 现 。 图 4- 49 中 剩余 的 空白 项 已 经 被 蔡 图 4-53” 带 有 错误 处 理子 
换 为 对 错误 处 理 与 过 程 的 调用 程序 的 LR 语法 分 析 表 

错误 处 理 例 程 如 下 : l 
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el: 这 个 例 程 在 状态 0、 2、4 和 5 上 被 调用 。 所 有 这 些 状态 都 期 望 读 人 一 个 运算 分 量 的 第 一 
个 符号 , 这 个 符号 可 能 是 id 或 左 括号 , 但 是 实际 读 人 的 却 是 +、* 或 输入 结束 标记 。 

将 状态 3( 状 态 0、2、4 和 5 在 输入 id Li GOTO 目标 ) 压 入 栈 中 ; 

发 出 诊断 信息 “缺少 运算 分 量 。” 

e2: 在 状态 0、1、2、4 和 5 上 发 现 输入 为 右 括号 时 调用 这 个 过 程 。 

从 输入 中 删除 右 括号 ; 

发 出 诊断 信息 “不 匹配 的 右 括号 

3: 当 在 状态 1 和 6 上, 期待 恋人 一 个 运算 符 却 发 现 了 一 个 或 左 括号 时 调用 。 

将 状态 4( 对 应 于 符号 + 的 状态 ) BA 
BP, 

发 出 诊断 信息 “缺少 运算 符 。” 

e4: 当 在 状态 6 上 发 现 输入 结束 标记 时 
调用 。 

将 状态 9( 对 应 于 右 括号 ) EAR; 

发 出 诊断 信息 “缺少 右 括号 。 

在 处 理 错 误 的 输入 id + ) 时 , 语法 分 
析 屁 进入 的 格局 序列 显示 在 图 4-54 中 。 O 图 4-54 ”一 个 LR 语法 分 析 器 所 做 
4.8.4 4.8 节 的 练习 的 语法 分 析 和 错误 恢复 步骤 

| 练习 4.8.1; 下 面 是 一 个 二 义 性 广 
法 , 它 描述 了 包含 4 个 二 目 中 缀 运算 符 且 具有 n 个 不 同 优先 级 的 表达 式 : 

E>E@,E|E6,E 1: |E@,E | ( E) | id 

1) 将 SLR 项 集 表示 为 n 的 函数 。 

2) 要 使 得 所 有 的 运算 符 都 是 左 结合 的 , 并且 0, 的 优先 级 高 于 0,, 0 的 优先 级 高 于 0, 依次 
类 推 , 我 们 应 该 如 何 解决 SLR 项 之 间 的 冲突 ? 

3) 根据 你 在 (2) 中 的 决定 , 给 出 相应 的 SLR 语法 分 [GS Bem |B 
析 表 。 EB» E> 6n-1 Bs | Es 

4) 图 4.55 中 的 无 二 义 性 文法 定义 了 相同 的 表达 式 集合 。 |p, fey TE 
对 这 个 文法 重复 (1) 和 (3 ) 部 分 。 En > (Bi) lid 

5) 比较 这 两 个 (二 义 性 和 无 二 义 性 ) 文 法 的 项 集 总 数 以 3 
及 它们 的 语法 分 析 表 的 大 小 , 你 能 得 出 什么 结论 ? 关于 二 义 。 国 xh Ceci acto 
性 表达 式 文法 的 使 用 , 这 个 比较 结果 告诉 我 们 什么 信息 ? T 

! 练习 4. 8. 2: 图 4-56 给 出 了 某 种 语句 的 文法 。 这 些 语句 和 练习 4. 4. 12 中 讨论 的 语句 类 似 。 
在 这 里 , 。 All s 仍然 是 分 别 代表 条 件 表达 式 和 “其 他 语句 ”的 终结 符号 。 

1) 为 这 个 文法 构造 一 个 LR 语法 分 析 表 , 并 用 解决 悬 













“不 匹配 的 右 括号 ” 
e2 删除 了 右 插 号 
“缺少 运算 分 量 ” 
el 将 状态 3 压 人 栈 中 














if e then stmt 


=P “else 问题 的 常用 方法 来 解决 其 中 的 冲突 。 if e then stmt else stmt 
2) 在 这 个 语法 分 析 表 中 填 人 额外 的 归 约 动作 或 适当 的 we deere 
错误 恢复 例 程 , 实现 语法 分 析 中 的 错误 恢复 。 
3) 给 出 你 的 语法 分 析 器 在 处 理 下 列 输入 时 的 行为 : list ; att 


stmt 





@) if e then s ; if e then s end 
@ while e do begin s ; if e then s ; end 图 4-56， 某 类 语句 的 文法 
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4.9 语法 分 析 器 生成 工具 


环节 将 介绍 如 何 使 用 语法 分 析 器 生成 工具 来 帮助 构造 一 个 编译 器 的 前 端 。 我 们 将 使 用 LALR 
语法 分 析 器 生成 工具 Yace 作为 我 们 讨论 的 基础 ， 因 为 它 实 现 了 我 们 在 前 两 闻 中 讨论 的 很 多 概念 ， 
并 且 这 个 工具 很 容易 获得 。Yace 表示 “yet another compiler-compiler” , BP “又 一 个 编译 器 的 编译 
器 ”。 这 个 名 字 反 映 出 当 S. C. Johnson 在 20 世纪 70 年 代 早期 创建 出 Yace 的 第 一 个 版 本 时 ， 语法 
分 析 器 生成 工具 非常 流行 。Yace 在 UNIX 系统 中 是 以 命令 的 方式 出 现 的 ， 它 已 经 用 于 实现 多 个 编 
译 器 产品 。 
4.9.1 语法 分 析 器 生成 工具 Yace 

按照 图 4.57 中 演示 的 方法 就 可 以 使 用 Yace 来 构造 一 个 翻译 器 。 首 先 要 准备 好 一 个 文件 , 比 
如 translate. y, 文件 中 包含 了 对 将 要 构造 的 翻译 器 的 规约 。UNIX 系统 命令 


yacc translate.y tas 
使 用 算法 4. 63 中 给 出 的 LALR 方法 将 文件 规约 pois 

translate. y 转换 成 为 一 个 名 为 了 tab.e HY C 程序 。 rn at oy = 
y-tab.c a.out 


程序 y tab. c 是 一 个 用 C 语言 编写 的 LALR 语法 分 
图 4-57 M Yacc 创建 一 个 输入 /输出 翻译 器 











析 器 , 另外 还 包括 由 用 户 准备 的 C 语言 例 程 。 其 
中 的 LALR 分 析 表 是 按照 4.7 节 中 描述 的 方法 压 
缩 的 。 使 用 命令 
cc y.tab.c -1y© 
对 y tab. e 进行 编译 , 并 和 包含 LR 语法 分 析 程序 的 库 ly 连接, 我 们 就 得 到 了 想 要 的 目标 程序 
a. out。 这 个 程序 执行 了 由 最 初 的 Yaco 程序 translate. y 所 描述 的 翻译 工作 。 如 果 需 要 其 他 过 程 ， 
它们 可 以 和 其 他 的 C 程序 一 样 ， 和 y. tab. c 一 起 编译 并 加 载 。 
一 个 Yace 源 程序 由 三 个 部 分 组 成 : 
ig 
翻译 规则 
abit C 语言 例 程 
AJ 为 了 说 明 如 何 编写 一 个 Yace 源 程序 , 我 们 构造 一 个 简单 的 桌 上 计算 器 。 该 计算 器 读 
入 一 个 算术 表达 式 , 对 表达 式 求 值 , 然后 打印 出 表达 式 的 结果 。 我 们 将 从 下 面 的 算术 表达 式 文法 
开始 构造 这 个 桌 上 计算 器 : 
E>E +TIT 
T—T * FIF 
F—( E ) | digit 
其 中 的 词法 单元 digit 是 一 个 0 ~9 之 间 的 数字 。 根 据 这 个 文法 得 到 的 Yacc 桌 上 计算 器 程序 显示 
在 图 4-58 中 。 E 
声明 部 分 
一 个 Yace 程序 的 声明 部 分 分 为 两 节 , 它 们 都 是 可 选 的 。 在 第 一 节 中 放置 通常 的 C 声明 , 这 个 
声明 用 % | 和 | % 括 起 来 。 那 些 由 第 二 和 第 三 部 分 中 的 翻译 规则 及 过 程 使 用 的 临时 变量 都 在 这 里 


日、 函数 库 的 名 字 ly 和 具体 系统 相关 。 
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声明 。 在 图 4-58 中 , 这 一 节 只 包含 include 语句 

#include <ctype.h> 
这 个 语句 使 得 C 语言 的 预 处 理 器 将 标准 头 文件 < ctype. h > 包含 进来 ,这 个 头 文件 中 包含 了 断言 
isdigit, 

在 声明 部 分 中 还 包括 对 词法 单元 的 声明 。 在 图 4-58 H, 语句 

%token DIGIT 
声明 DIGIT 是 一 个 词法 单元 。 在 这 一 节 中 声明 的 词法 单元 可 以 在 Yace 规约 的 第 二 和 第 三 部 分 
中 使 用 。 如 果 向 Yace 语法 分 析 器 传送 词法 单元 的 词法 分 析 器 是 使 用 Lex 创建 的 , 那么 如 3.5.2 
节 中 讨论 的 , Lex 生成 的 词法 分 析 器 也 可 以 使 用 这 里 声明 的 词法 单元 。 
%{ 


#include <ctype.h> 
分 


%token DIGIT 
uh 
line : expr '\n' { printf("%d\n", $1); } 













expr: expr '+' term { $$ = $1 + $3; } 
| term 


term : term '*' factor { $$ = $1 * $3; } 


| factor 
factor : '(' expr ')' { $$ = $2; } 
| DIGIT 
ry 
yylex() { 
int c; 


c = getchar(); 

if (isdigit(c)) { 
yylval = c-'0'; 
return DIGIT; 












} 


return c; 







图 4-58 一 个 简单 的 桌 上 计算 器 的 Yace 规约 


翻译 规则 部 分 
我 们 将 翻译 规则 放置 在 Yace 规约 中 第 一 个 %% 对 之 后 的 部 分 。 每 个 规则 由 一 个 文法 产生 式 
和 一 个 相关 联 的 语义 动作 组 成 。 我 们 前 面 写作 
<PERR >> <PERR zl FERE >l … 1 < 产生 式 体 > ， 
的 一 组 产生 式 在 Yace 中 被 写成 
< 产生 式 头 >: < 产生 式 体 >1| < 语义 动作 > || 
|I < FERH >| <TR BITE >» | 


l< FERR >, < 语义 动作 > | 


在 一 个 Yace FERH, 如 果 一 个 由 字母 和 数位 组 成 的 字符 串 没 有 加 引号 且 未 被 声明 为 词法 
单元 , 它 就 会 被 当 作 非 终结 符号 处 理 。 带 引号 的 单个 字符 ,比如 “<，， 会 被 当 作 终结 符号 c 以 及 
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它 所 代表 的 词法 单元 所 对 应 的 整数 编码 ( 即 Lex 将 把 “c? 的 字符 编码 当 作 整数 返回 给 语法 分 析 
器 ) 。 不 同 的 产生 式 体 用 竖 线 分 开 , 每 个 产生 式 头 以 及 它 的 可 选 产生 式 体 及 语义 动作 之 后 跟 一 个 
分 号 。 第 一 个 产生 式 的 头 符号 被 看 作 开始 符号 。 

一 个 Yace 语义 动作 是 一 个 C 语句 的 序列 。 在 一 个 语义 动作 中 , 符号 $$ 表示 和 相应 产生 式 头 
的 非 终 结 符号 关联 的 属性 值 , 而 发 表示 和 相应 产生 式 体 中 第 ;个 文法 符号 (终结 符号 或 非 终结 符 
号 ) 关 联 的 属性 值 。 当 我 们 按照 一 个 产生 式 进 行 归 约 时 就 会 执行 和 该 产生 式 相 关联 的 语义 动作 ， 
因此 语义 动作 通常 根据 Si 的 值 来 计算 $8 的 值 。 在 上 面 的 Yace 规范 中 ,我 们 将 两 个 产生 式 

E>E + TIT 

和 它们 的 相关 语义 动作 写作 : 


expr : expr '+' term { $$ = $1 + $3; } 
| term 


请 注意 ,第 一 个 产生 式 中 的 非 终结 符号 term 是 该 产生 式 体 中 的 第 三 个 文法 符号 , 而 + 是 第 
二 个 文法 符号 。 与 第 一 个 产生 式 关联 的 语义 动作 将 产生 式 体 中 的 expr 和 term 的 值 相 加 , 并 把 
结果 赋 给 产生 式 头 上 的 非 终结 符号 sxpr。 我 们 省 略 了 第 二 个 产生 式 的 语义 动作 ， 因为 对 于 体 中 
只 包含 一 个 文法 符号 的 产生 式 , 默认 的 语义 动作 就 是 拷贝 属性 值 。 总 的 来 说 , 默认 动作 是 | $ $ 
= $ Ls ie 

请 注意 ,我们 向 这 个 Yace 规范 中 加 入 了 一 个 新 的 开始 符号 产生 式 


line : expr '\n' { printf("%d\n", $1); } 

这 个 产生 式 说 明 桌 面 计 算 器 的 输入 是 一 个 跟着 换行 符 的 表达 式 ， 和 这 个 产生 式 相关 的 语义 
动作 打印 出 了 输入 表达 式 的 十 进 制 取 值 和 一 个 换行 符 。 

辅助 性 C 语言 例 程 部 分 

一 个 Yace 规约 的 第 三 部 分 由 辅助 性 C 语言 例 程 组 成 。 这 里 必须 提供 一 个 名 为 yylex( ) 的 
词法 分 析 器 。 用 Lex 来 生成 yylex( ) 是 一 个 常用 的 选择 , 见 4.9.3 节 。 在 需要 时 可 以 添加 错误 
恢复 例 程 这 样 的 过 程 。 

词法 分 析 器 yylex( ) 返 回 一 个 由 词法 单元 名 和 相关 属性 值 组 成 的 词法 单元 。 如 果 要 返回 一 
个 词法 单元 名 字 , 比如 DIGIT, 那么 这 个 名 字 必 须 先 在 Yace 规约 的 第 一 部 分 进行 声 明 。 一 个 词法 
单元 的 相关 属性 值 通过 一 个 Yace 定义 的 变量 yylval 传送 给 语法 分 析 器 。 

图 4-58 中 的 词法 分 析 器 是 非常 原始 的 。 它 使 用 C 函数 get char( ) 逐个 读 和 人 字符。 如 果 字 
符 是 一 个 数位 , 这 个 数位 的 值 就 存放 在 变量 yylval H, 返回 词法 单元 的 名 字 DIGIT。 否 则 , 字 
符 本 身 被 当 作词 法 单元 名 返回 。 
4.9.2 使 用 带 有 二 义 性 文法 的 Yacc 规约 

现在 让 我 们 修改 这 个 Yacc 规约 , 使 得 这 个 桌面 计算 器 更 加 有 用 。 首 先 ， 我 们 将 允许 桌面 计 
算 器 对 一 个 表达 式 序 列 进行 求 值 ,其 中 每 个 表达 式 占 一 行 。 我 们 还 将 允许 表达 式 之 间 出 现 空 行 。 
我 们 将 第 一 个 规则 修改 为 : 

lines : lines expr '\n' { printf("%g\n", $2); } 

.| lines '\n! 
| /* empty */ 


TE Yace H, 像 第 三 行 那样 的 空白 产生 式 表 示 es 

其 次 , 我 们 将 扩展 表达 式 的 种 类 , 使 得 它 的 语言 可 以 包含 数字 ， 而 不 是 单个 数位 ,并 且 包 含 
算术 运算 符 + 、- (包括 双 目 和 单 目 ) 、* 和 /。 描述 这 类 表达 式 的 最 容易 的 方式 是 使 用 下 面 的 二 
MPENN: 
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ROES hy DW ee Nb Bees EDS ECE ) | number 
得 到 的 Yace 规约 如 图 4-59 所 示 。 


[xt 
#include <ctype.h> 

#include <stdio.h> 

#define YYSTYPE double /* double type for Yacc stack */ 
分 

%token NUMBER 





Lott teune: 

Alert. vet T/r 

Yright UMINUS 

hh 

lines : lines expr '\n' { printf("%g\n", $2); } 
lines '\n' 








| /* empty */ 
| expr: expr’ '+! expr { $$ = $1 + $3; } 
| expr '-' expr { $$ = $1 - $3; } 
| expr '*' expr { $$ = $1 * $3; } 
| ney Wl expr { $$ = $1 / $3; } 
| "iC" expr: *)' { $$ = $2; } 
| '-' expr Y%prec UMINUS { $$ = - $2; } 
| NUMBER 
hh 
yylex() { 
int č; 
while ( ( c = getchar() ) = Lay 
| a ne J 


ate stdin); 
scanf ("⁄1f", &yylval) ; 
return NUMBER; 


i; 
return c; 


J 





图 4-59 一 个 更 加 先进 的 桌 上 计算 器 的 Yacc 规约 


因为 图 4-59 中 Yace 规约 的 文法 是 二 义 性 的 ,LALR 算法 将 会 出 现 语 法 分 析 动 作 冲 突 。Yace 
会 报告 产生 的 语法 分 析 动 作 冲 突 的 数量 。 使 用 -v 选项 调用 Yace 可 以 得 到 关于 项 集 和 语法 分 析 
动作 冲突 的 描述 。 这 个 选项 会 产生 一 个 附加 的 文件 y.output, 它 包 含 文法 的 项 集 的 内 核 , 对 
LALR 算法 产生 的 语法 分 析 动 作 冲 突 的 描述 , 以 及 LR 语法 分 析 表 的 一 个 可 读 表示 形式 。 这 个 可 
读 表 示 形 式 显 示 了 Yace 是 如 何 解 决 这 些 语 法 分 析 动 作 冲 突 的 。 只 要 Yace 报告 发 现 了 语法 分 析 
动作 冲突 , 那么 最 好 创建 并 查阅 y. output 文件 , 了 解 为 什么 会 产生 这 些 语法 分 析 动 作 冲 突 , 并 
检查 Yace 是 否 已 经 正确 解决 了 它们 。 

除非 另行 指定 ,否则 Yace 会 使 用 下 面 的 两 个 规则 来 解决 所 有 的 语法 分 析 动 作 冲 突 : 

1) 解决 一 个 归 约 / 归 约 冲突 时 , 选择 在 Yace 规约 中 列 在 前 面 的 那个 冲突 产生 式 。 

2) 解决 移 人 / 归 约 冲突 时 总 是 选择 移 人 。 这 个 规则 正确 地 解决 了 因为 悬空 else 二 义 性 而 产 
生 的 移入 / 归 约 冲突 。 

因为 这 些 默认 规则 不 可 能 总 是 编译 器 作者 需要 的 , 所 以 Yace 提供 了 一 个 通用 的 机 制 来 解决 
移入 / 归 约 冲突 。 在 声明 部 分 , 我 们 可 以 给 终结 符号 赋予 优先 级 和 结合 性 。 声 明 

Yleft t+! '=-! 


使 得 + 和 -具有 相同 的 优先 级 , 并 且 都 是 左 结合 的 。 我 们 可 以 把 一 个 运算 符 声 明 为 右 结合 的 ， 比 如: 
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Tripe Ti 
我 们 可 以 声明 一 个 运算 符 是 非 结合 性 的 二 目 运算 符 ( 即 这 个 运算 符 的 两 次 出 现 不 能 合并 到 一 
起 ) ,方法 如 下 : 


Ynonassoc '<' 


词法 单元 的 优先 级 是 根据 它们 在 声明 部 分 的 出 现 顺序 而 定 的 。 优先 级 最 低 的 词法 单元 最 先 
出 现 。 局 一 个 声明 中 的 词法 单元 具有 相同 的 优先 级 。 因 此 ,图 4-59 中 的 声明 

Yright UMINUS 
赋予 词法 单元 UMINUS 的 优先 级 要 高 于 前 面 五 个 终结 符号 的 优先 级 。 

除了 给 各 个 终结 符号 赋予 优先 级 ，Yace 也 可 以 给 和 某 个 冲突 相关 的 各 个 产生 式 赋予 优先 级 
和 结合 性 ,来 解决 移 人 / 归 约 冲突 。 如 果 它 必须 在 移 人 一 个 输入 符号 a 和 按照 4->a 进行 归 约 之 
间 进 行 选择 , 那么 当 这 个 产生 式 的 优先 级 高 于 a 的 优先 级 时 , 或 者 当 两 者 的 优先 级 相同 但 产生 式 
是 左 结合 的 时 ，Yace 就 选择 归 约 ;否则 就 选择 移入 动作 。 

通常 ,一 个 产生 式 的 优先 级 被 设 定 为 它 的 最 右 终结 符号 的 优先 级 。 在 大 多 数 情 况 下 , 这 是 一 
个 明智 的 选择 。 比 如 , 给 定 产生 式 

B= 和 BE 

我 们 将 在 向 前 看 符号 为 + 时 按照 ->E + EHTA, 因为 产生 式 体 中 的 + 和 这 个 向 前 看 符 
号 具有 相同 的 优先 级 , 且 它 是 左 结合 的 。 在 向 前 看 符号 为 * 时, 我们 将 选择 移入 ,因为 这 个 向 前 
看 符号 的 优先 级 高 于 产生 式 体 中 + 的 优先 级 。 

在 那些 最 右 终结 符号 不 能 为 产生 式 提供 正确 优先 级 的 情况 下 , 我 们 可 以 在 产生 式 后 增加 一 
个 标记 

%prec (终结 符号 
来 指明 该 产生 式 的 优先 级 。 此 时 这 个 产生 式 的 优先 级 和 结合 性 将 和 这 个 终结 符号 相同 ,而 这 个 终 
结 符号 的 优先 级 和 结合 性 应 该 在 声明 部 分 定义 。Yacee 不 会 报告 那些 已 经 使 用 这 个 优先 级 /结合 性 
机 制 解 决 了 的 移入 / 归 约 冲突 。 

这 里 的 “终结 符号 ”可 以 仅仅 作为 一 个 占 位 符 , 就 像 图 4-59 中 的 UMINUS 那样 。 这 个 终结 符 
号 不 会 被 词法 分 析 器 返回 , 声明 它 的 目的 仅仅 是 为 了 定义 一 个 产生 式 的 优先 级 。 在 图 4-59 中 ， 

日 

_— UMINUS 
赋予 词法 单元 UMINUS 一 个 高 于 * 和 /的 优先 级 。 在 翻译 规则 部 分 ,产生 式 

expr > = expr. 

后 面 的 标记 

%prec UMINUS 
使 得 这 个 产生 式 中 的 单 目 减 运算 符 具有 比 其 他 运算 符 更 高 的 优先 级 。 
4.9.3 M Lex 创建 Yacc 的 词法 分 析 器 

Lex 的 作用 是 生成 可 以 和 Yace 一 起 使 用 的 词法 分 析 器 。Lex 库 11 将 提供 一 个 名 为 Yylex( ) 
的 驱动 程序 。Yace 要 求 它 的 词法 分 析 器 的 名 字 为 yylex( ) 。 如 果 用 Lex 来 生成 词法 分 析 器 , H 
么 我 们 可 以 将 Yace 规约 的 第 三 部 分 的 例 程 yylex( ) 替换 为 语 名 


#include "lex.yy.c" 

并 令 每 个 Lex 动作 都 返回 Yace 已 知 的 终结 符号 。 通 过 使 用 语句 #include "lex.yy.c", 
程序 yylex 能 够 访问 Yace 定义 的 词法 单元 名 字 ， 因 为 Lex 的 输出 文件 是 作为 Yace 的 输出 文件 
y.tab.c 的 一 部 分 被 编译 的 。 

在 UNIX 系统 中 ,如 果 Lex 规约 存放 在 文件 first.1 中, H Yace 规约 在 second.y 中 ,我 
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们 可 以 使 用 命令 number [0-9]+\.?|[0-9]*\.[0-9]+ 
lex first.1 hh 
yacc second.y Ci { /* skip blanks */ } 
cc y.tab.c -ly -11 {number} { sscanf(yytext, "/1f", &yylval); 
5 return NUMBER; } 
来 得 到 想 要 的 翻译 器 。 \nl. { return yytext[0]; } 





图 4- 60 中 的 Lex 规约 可 以 用 在 图 4-59 中 需 
要 词法 分 析 器 的 地 方 。 最 后 的 表示 “任意 字符 ” 图 4- 60 图 4-59 中 的 yylex 的 Lex 规约 
的 模式 必须 被 写作 n |. ， 因 为 在 Lex 中 , 点 ( .) 表示 除了 换行 符 之 外 的 任意 字符 ; 
4.9.4 Yacc 中 的 错误 恢复 

Yace 的 错误 恢复 使 用 了 错误 产生 式 的 形式 。 首 先 , 用 户 定义 了 哪些 “主要 ” 非 终结 符号 将 具 
有 相关 的 错误 恢复 动作 。 通 常 的 选择 是 非 终结 符号 的 某 个 子 集 ,包括 那些 用 于 生成 表达 式 ， E 
句 、 块 和 函数 的 非 终结 符号 。 然 后 ,用 户 在 文法 中 加 入 形 如 A>error a 的 错误 产生 式 , 其 中 4 是 
一 个 主要 非 终结 符号 ，a 是 一 个 可 能 为 空 的 文法 符号 串 ; error 是 Yace 的 一 个 保留 字 。Yace 把 这 
样 的 错误 产生 式 当 作 普 通 产生 式 , 根据 这 个 规约 生成 一 个 语法 分 析 器 。 

然而 , 当 Yace 生成 的 语法 分 析 器 碰 到 一 个 错误 时 ， 它 就 以 一 种 特殊 的 方法 来 处 理 那 些 对 应 
项 集 包 含 错 误 产 生 式 的 状态 。 当 碰 到 一 个 错误 时 ，Yace 就 会 从 它 的 栈 中 不 断 弹出 符号 , 直到 它 
磁 到 一 个 满足 如 下 条 件 的 状态 : 该 状态 对 应 的 项 集 包含 一 个 形 如 A - error a 的 项 。 然后 语法 
分 析 器 就 好 像 在 输入 中 看 到 了 error, 将 虚构 的 词法 单元 error BAH, 

当 a 为 e 时 , 语法 分 析 器 立刻 就 执行 一 次 归 约 到 A 的 动作 ,并 调用 和 产生 式 4_yeiror 相关 
的 语义 动作 (这 可 能 是 一 个 用 户 定 义 的 错误 恢复 例 程 ) 。 然后 语法 分 析 器 抛弃 一 些 输 入 符号 , 直 
到 它 找 到 某 个 使 它 可 以 继续 进行 正常 的 语法 分 析 的 符号 为 止 。 

MR a 不 为 空 ，Yacc 将 向 前 跳 过 一 些 输入 符号 , 寻找 可 以 被 归 约 为 a 的 子 串 。 WOR a 全 部 
由 终结 符号 组 成 ,那么 它 就 在 输入 中 寻找 这 个 终结 符号 串 ， 并 将 它们 移 大 到 栈 中 进行 “WAR” , 
此 时 ,语法 分 析 器 栈 的 顶部 是 error w。 然 后 语法 分 析 器 将 把 error a 归 约 为 A, 并 继续 进行 正常 
的 语法 分 析 。 

比如 , 一 个 形 如 

stmi— error ; 

的 错误 产生 式 规定 语法 分 析 器 在 磁 到 一 个 错误 的 时 候 要 跳 到 下 一 个 分 号 之 后 ， 并 假装 已 经 找到 
了 一 个 语句 。 这 个 错误 产生 式 的 语义 例 程 不 需要 处 理 输 入 ， 而 是 可 以 直接 生成 诊断 消息 并 做 出 
一 些 处 理 ， 比 如 设置 一 个 标志 来 禁止 生成 目标 代码 。 
图 4- 61 在 图 4-59 所 示 的 Yace 桌 上 计算 器 中 增加 了 错误 产生 式 

lines : error '\n' 

这 个 错误 产生 式 使 得 这 个 桌 上 计算 器 在 输入 中 发 现 一 个 语法 错误 时 停止 正常 的 语法 分 析 工 
作 。 当 碰 到 错误 时 ， 桌 上 计算 器 的 语法 分 析 器 开始 从 它 的 栈 中 弹出 符号 ， 直到 它 在 栈 中 发 现 一 个 
在 输入 为 error 时 执行 移入 动作 的 状态 。 状 态 0 就 是 这 样 的 一 个 状态 (在 这 个 例子 里 面 , 它 是 唯 
一 一 个 这 样 的 状态 ) , 因为 它 的 项 包括 了 

lines—-+error '\n' 

同时 , 状态 0 总 是 在 栈 的 底部 。 语 法 分 析 器 将 词法 单元 error 移 人 栈 中 , 然后 向 前 跳 过 输入 
符号 , 直到 它 发 现 一 个 换行 符 为 止 。 此 时 ， 语法 分 析 器 将 换行 符 移 人 到 栈 中 , Ki error 'n' 归 约 
Ai lines, 并 发 出 诊断 消息 “请 重新 输入 前 一 行 ”。 专 门 的 Yace 例 程 yyerrok 将 语法 分 析 器 的 状 
态 重 新 设置 为 正常 操作 模式 。 iad 
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%{ 

#include <ctype.h> 

#include <stdio.h> 

#define YYSTYPE double /* double type for Yacc stack */ 
ht 

token NUMBER 


Aloft Pa ve! 

Klett) ee Ny" 

{right UMINUS 

hh 

lines : lines expr '\n' { printf(%g\n", $2); } 
lines '\n' 
/* empty */ 
error '\n' { yyerror("reenter previous line:"); 

yyerrok; } 


? 

: expr "+" expr 
expr '-' expr 
expr '*' expr 


| { 
| { 
| expr '/' expr { 
foe! expr) { 
| '-' expr ‘%prec UMIN 
| NUMBER 


hh 
#include "lex.yy.c" 
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4.9.5 4.9 节 的 练习 

| 练习 4.9. 1: 编写 一 个 Yacc 程序 。 它 以 布尔 表达 式 ( 如 练习 4. 2.2(7) 中 的 文法 所 描述 的 ) 
作为 输入 , 并 计算 出 这 个 表达 式 的 值 。 

| 练习 4. 9. 2: 编写 一 个 Yacc 程序 。 它 以 列表 (如 练习 4. 2.2(5) 中 的 文法 所 定义 的 , 但 是 其 
元 素 可 以 是 任意 的 单个 字符 , 而 不 仅仅 是 a) 作为 输入 , 并 输出 这 个 列表 的 线性 表示 , 即 这 些 元 素 
的 单一 列表 , 并 且 元 素 顺序 和 它们 在 输入 中 的 顺序 相同 。 

| 练习 4.9.3: 编写 一 个 Yacc 程序 。 它 的 功能 是 说 明 输入 是 否 一 个 回 文 ( 即 向 前 和 向 后 读 都 
一 样 的 字符 序列 ) 。 

11 练习 4.9.4: 编写 一 个 Yace 程序 。 它 以 正则 表达 式 (如 练习 4: 2.2(4) 中 文法 的 定义 的 ， 
但 是 参数 可 以 是 任意 字符 , 而 不 仅仅 是 a) 作为 输入 , 并 输出 一 个 能 够 识别 相同 语言 的 不 确定 有 
穷 自动 机 的 转换 表 。 


4.10 第 4 章 总 结 


。 语法 分 析 器 。 语 法 分 析 器 的 输入 是 来 自 词法 分 析 器 的 词法 单元 序列 。 它 将 词法 单元 的 名 
字 作为 一 个 上 下 文 无 关 文法 的 终结 符号 。 然 后 ,语法 分 析 器 为 它 的 词法 单元 输入 序列 构造 
出 一 棵 语法 分 析 树 。 可 以 象征 性 地 构造 这 棵 语法 分 析 树 ( 即 仅仅 遍历 相应 的 推导 步骤 ) ， 
也 可 以 显 式 生成 分 析 树 。 

e 上 下 文 无 关 文法 。 一 个 文法 描述 了 一 个 终结 符号 集合 (输入 ) , 另 一 个 非 终结 符号 集合 (表示 
语法 构造 的 符号 ) 和 一 组 产生 式 。 每 个 产生 式 说 明了 了 如何 从 一 些 部 件 构造 出 某 个 非 终结 符号 
所 代表 的 符号 串 。 这 些 部 件 可 以 是 终结 符号 , 也 可 以 是 另外 一 些 非 终结 符号 所 代表 的 串 。 一 
个 产生 式 由 头 部 (将 被 替换 的 非 终结 符号 ) 和 产生 式 体 (用 来 蔡 换 的 文法 符号 串 ) 组 成 。 
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© 推导 。 从 文法 的 开始 非 终结 符号 出 发 , 不 断 将 某 个 非 终 结 符号 替换 为 它 的 某 个 产生 式 体 的 过 程 
称 为 推导 。 如 果 总 是 蔡 换 最 左 (最 右 ) 的 非 终结 符号 , 那么 这 个 推导 就 称 为 最 左 推导 (最 右 推导 ) o 

o 语法 分 析 树 。 一 棵 语法 分 析 树 是 一 个 推导 的 图 形 表示 。 在 推导 中 出 现 的 每 一 个 非 终 结 符号 都 在 
树 中 有 一 个 对 应 结 点 。 一 个 结 点 的 子 结 点 就 是 在 推导 中 用 来 蔡 换 该 结 点 对 应 的 非 终 结 符号 的 文 
法 符号 串 。 在 同一 终结 符号 串 的 语法 分 析 树 、 最 左 推导 、 最 右 推 导 之 间 存 在 一 一 对 应 关系 。 

e 二 义 性 。 如 果 一 个 文法 的 某 些 终结 符号 串 有 两 棵 或 多 棵 语法 分 析 树 , 或 者 等 价 地 说 有 两 个 
或 多 个 最 左 推导 /最 右 推 导 , 那么 这 个 文法 就 称 为 二 义 性 文法 。 在 实践 中 的 大 多 数 情 况 下 ， 
我 们 可 以 对 一 个 二 义 性 文法 进行 重新 设计 , 使 它 变 成 一 个 描述 相同 语言 的 无 二 义 性 文法 。 
然而 , 有 时 使 用 二 义 性 文法 并 应 用 一 些 技 巧 可 以 得 到 更 加 高 效 的 语法 分 析 器 。 

日 自 顶 向 下 和 自 底 向 上 语法 分 析 。 语 法 分 析 器 通常 可 以 按照 它们 的 工作 方式 分 为 自 顶 向 下 的 
(从 文法 的 开始 符号 出 发 ， 从 顶部 开始 构造 语法 分 析 树 ) 和 自 底 向 上 的 (从 构成 语法 分 析 树 叶 
子 结 点 的 终结 符号 串 开始 , 从 底部 开始 构造 语法 分 析 树 ) 。 自 项 向 下 的 语法 分 析 器 包括 递归 
下 降 语法 分 析 器 和 LL 语法 分 析 器 ， 而 最 常见 的 自 底 向 上 语法 分 析 器 是 LR 语法 分 析 器 。 

e 文法 的 设计 。 和 自 底 向 上 语法 分 析 器 使 用 的 文法 相 比 , 适合 进行 自 顶 向 下 语法 分 析 的 文法 
通常 较 难 设 计 。 我 们 必须 要 消除 文法 的 左 递归 , 即 一 个 非 终结 符号 推导 出 以 这 个 非 终结 符 
号 开头 的 符号 串 的 情况 。 我 们 还 必须 提取 左 公 因子 一 一 也 就 是 对 同一 个 非 终 结 符号 的 具 
有 相同 的 产生 式 体 前 缀 的 多 个 产生 式 进 行 分 组 。 

日 递归 下 降 语法 分 析 器 。 这 些 分 析 器 对 每 个 非 终结 符号 使 用 一 个 过 程 。 这 个 过 程 查看 它 的 
输入 并 确定 应 该 对 它 的 非 终结 符号 应 用 哪个 产生 式 。 相 应 产生 式 体 中 的 终结 符号 在 适当 
的 时 候 和 输入 中 的 符号 进行 匹配 ， 而 产生 式 体 中 的 非 终结 符号 则 引发 对 它们 的 过 程 的 调 
用 。 当 选择 了 错误 的 产生 式 时 , 有 可 能 需要 进行 回溯 。 

o LL(1) 语 法 分 析 器 4 对 于 一 个 文法 , 如 果 只 需要 查看 下 一 个 输入 符号 就 可 以 选择 正确 的 产生 式 
来 扩展 一 个 给 定 的 非 终结 符号 , 那么 这 个 文法 就 称 为 是 LL(1) 的 。 这 类 文法 允许 我 们 构造 出 一 
个 预测 语法 分 析 表 。 对 于 每 个 非 终结 符号 和 每 个 向 前 看 符号 , 这 个 表 指 明了 应 该 选择 哪个 产生 
式 。 在 某 些 或 所 有 没有 合法 产生 式 的 空 条 目 中 放置 错误 处 理 例 程 有 助 于 实现 错误 恢复 。 

日 移入 - 归 约 语法 分 析 技术 。 自 底 向 上 语法 分 析 器 一 般 按照 如 下 方式 运行: 根据 下 一 个 输入 
符号 (向 前 看 符号 ) 和 栈 中 的 内 容 , 选择 是 将 下 一 个 输入 移 人 栈 中 , 还 是 将 栈 顶 部 的 某 些 符 
号 进行 归 约 。 归 约 步骤 将 栈 顶 部 的 一 个 产生 式 体 蔡 换 为 这 个 产生 式 的 头 。 

e TNA. 在 移 人 = 归 约 语法 分 析 过 程 中 , 栈 中 的 内 容 总 是 一 个 可 行 前 缀 一 一 也 就 是 某 个 
最 右 句 型 的 前 缀 ,上 且 这 个 前 绥 的 结尾 不 会 比 这 个 名 型 的 句柄 的 结尾 更 靠 右 。 句 柄 是 在 这 个 
句 型 的 最 右 推导 过 程 中 在 最 后 一 步 加 入 此 名 型 中 的 子 串 。 

e 有 效 项 。 在 一 个 产生 式 的 体 中 某 处 加 上 一 个 点 就 得 到 一 个 项 。 一 个 项 对 某 个 可 行 前 级 有 
效 的 条 件 是 该 项 的 产生 式 被 用 来 生成 该 可 行 前 缀 对 应 的 句 型 的 句柄 , 且 这 个 可 行 前 缀 中 
包括 项 中 位 于 点 左边 的 所 有 符号 , 但 是 不 包含 点 右边 的 任何 符号 。 

OLR 语法 分 析 器 。 每 一 种 LR 语法 分 析 器 都 首先 构造 出 各 个 可 行 前 缀 的 有 效 项 的 项 集 ( 称 为 
LR 状态 ), 并 且 在 栈 中 跟踪 每 个 可 行 前 缀 的 状态 。 有 效 项 集合 引导 语法 分 析 器 做 出 移 
和 -=- 归 约 决定 。 如 果 项 集中 某 个 有 效 项 的 点 在 产生 式 体 的 最 右 端 , 那么 我 们 就 进行 归 约 ; 
如 果 下 一 个 输入 符号 出 现在 某 个 有 效 项 的 点 的 右边 , 我 们 就 会 把 向 前 看 符号 移 人 栈 中 。 

© 简单 LR 语法 分 析 器 。 在 一 个 SLR 语法 分 析 器 中 , 我们 按照 某 个 点 在 最 右 端的 有 效 项 进行 
归 约 的 条 件 是 : 向 前 看 符号 能 够 在 某 个 名 型 中 跟 在 该 有 效 项 对 应 的 产生 式 的 头 符号 的 后 
面 。 如 果 没 有 语法 分 析 动 作 冲 突 , 那么 这 个 文法 就 是 SLR 的 ;就 可 以 应 用 这 个 方法 。 所 谓 
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没有 语法 分 析 动作 冲突 , 就 是 说 对 于 任意 项 集 和 任意 向 前 看 符号 , 都 不 存在 两 个 要 归 约 的 
FE, 也 不 会 同时 存在 归 约 或 移 人 的 可 选 动作 。 

o 规范 LR 语法 分 析 器 。 这 是 一 种 更 复杂 的 LR 语法 分 析 器 。 它 使 用 的 项 中 增加 了 一 个 向 前 
看 符号 集合 。 当 应 用 这 个 产生 式 进行 归 约 时 ,下 一 个 输入 符号 必须 在 这 个 集合 中 。 只 有 当 
存在 一 个 点 在 最 右 端的 有 效 项 , 并 且 当 前 的 向 前 看 符号 是 这 个 项 允许 的 向 前 看 符号 之 一 
时 , 我 们 才 可 以 决定 按照 这 个 项 的 产生 式 进行 归 约 。 一 个 规范 LR 语法 分 析 器 可 以 避免 某 
些 在 SLR 语法 分 析 器 中 出 现 的 分 析 动 作 冲 突 , 但 是 它 的 状态 常常 会 比 同一 个 文法 的 SLR 
语法 分 析 器 的 状态 更 多 。 

向 前 看 LR 语法 分 析 器 。LALR 语法 分 析 器 同时 具有 SLR 语法 分 析 器 和 规范 LR 语法 分 析 
器 的 很 多 优点 。 它 将 具有 相同 核心 (忽略 了 相关 向 前 看 符号 集合 之 后 的 项 的 集合 ) 的 状态 
合并 到 一 起 。 因 此 , 它 的 状态 数量 和 SLR 语法 分 析 器 的 状态 数量 相同 , 但 是 在 SLR 语法 分 
析 融 中 出 现 的 某 些 语法 分 析 动 作 冲 突 不 会 出 现在 LALR 语法 分 析 器 中 。LALR 语法 分 析 器 
是 实践 中 经 常 选择 的 方法 。 

三 义 性 文法 的 自 底 向 上 语法 分 析 。 在 很 多 重要 的 场合 下 ， 比 如 对 算术 表达 式 进 行 语法 分 析 
时 , 我 们 可 以 使 用 二 义 性 文法 , 并 利用 一 些 附加 的 信息 ， 比 如 运算 符 的 优先 级 , 来 解决 移 
人 和 归 约 之 间 的 冲突 , 或 者 两 个 不 同 产生 式 之 间 的 归 约 冲突 。 这 样 ,LR 语法 分 析 技 术 就 
被 扩展 应 用 于 很 多 二 义 性 文法 中 。 

Yacc。 语 法 分 析 器 生成 工具 Yace 以 一 个 (可 能 的 ) 二 义 性 文法 以 及 冲突 解决 信息 作为 输 
A, 构造 出 LALR 状态 集合 。 然 后 , 它 生 成 一 个 使 用 这 些 状 态 来 进行 自 底 向 上 语法 分 析 的 
函数 。 该 函数 在 执行 每 一 个 归 约 动作 时 都 会 调用 和 相应 产生 式 关 联 的 函数 。 
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具 , 它 接受 以 C++ 、Java 或 CHR SANE BIE. LLGen 是 一 个 基于 IL[1] 的 生成 工具 。 
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第 5 章 ”语法 制导 的 翻译 


本 章 继续 2. 3 节 的 主题 : 使 用 上 下 文 无 关 文 法 来 引导 对 语言 的 翻译 。 本 章 讨论 的 翻译 技术 将 
在 第 6 章 中 用 于 类 型 检查 和 中 间 代 码 生成 。 这 些 技术 也 可 以 用 于 实现 那些 完成 特殊 任务 的 小 型 
语言 。 本 章 包含 了 一 个 有 关 排 版 的 例子 。 
如 2.3.2 节 所 讨论 的 , 我 们 把 一 些 属 性 附加 到 代表 语言 构造 的 文法 符号 上 ,从 而 把 信息 和 一 
个 语言 构造 联系 起 来 。 语 法 制导 定义 通过 与 文法 产生 式 相 关 的 语义 规则 来 描述 属性 的 值 。 比 如 ， 
一 个 从 中 绥 表 达 式 到 后 绥 表 达 式 的 翻译 器 可 能 包含 如 下 产生 式 和 规则 
产生 式 语义 规则 
E> E,+T E.code = E\.code || T.code || ‘+ (5:1) 
这 个 产生 式 有 两 个 非 终结 符号 E 和 7, E 的 下 标 用 于 区 分 五 在 产生 式 体 中 的 出 现 和 五 在 产 
生 式 头 部 的 出 现 。E 和 7 都 有 一 个 字符 串 类 型 的 属性 code。 上 面 的 语义 规则 指明 字符 串 E. code 
是 通过 将 E. code, T. code 和 字符 + 连接 起 来 而 得 到 的 。 虽然 这 个 规则 明确 指出 对 的 翻译 结果 
是 根据 El 、7 的 翻译 结果 和 ”+ ”构造 得 到 的 , 但 直接 通过 字符 串 操作 来 实现 这 个 翻译 过 程 是 很 
低 效 的 。 
根据 2. 3.5 节 的 介绍 可 知 , 语法 制导 的 翻译 方案 在 产生 式 体 中 矢 和 人 了 称 为 语义 动作 的 程序 片 
段 。 比 如 


E>E,+T { print '+'} (5.2) 
按照 惯例 , 语义 动作 放 在 花 插 号 之 内 。( 对 于 作为 文法 符号 出 现 的 花 括 号 , 我们 将 用 单 引号 
把 它们 括 起 来 , 比如 { 和 “}”。) 一 个 语义 动作 在 产生 式 体 中 的 位 置 决定 了 这 个 动作 的 执行 顺 


序 。 在 产生 式 (5.2) 中 , 语义 动作 出 现在 所 有 文法 符号 之 后 。 一 般 情况 下 , 语义 动作 可 以 出 现在 
产生 式 体 中 的 任何 位 置 。 

对 于 这 两 种 标记 方法 , 语法 制导 定义 更 加 易 读 , 因此 更 适合 作为 对 翻译 的 规约 。 而 翻译 方案 
更 加 高 效 , 因此 更 适合 用 于 翻译 的 实现 。 

最 通用 的 完成 语法 制导 翻译 的 方法 是 先 构 造 一 棵 语法 分 析 树 , 然后 通过 访问 这 棵 树 的 各 个 
结 点 来 计算 结 点 的 属性 值 。 在 很 多 情况 下 ,翻译 可 以 在 扫描 分 析 过 程 中 完成 , 不 需要 构造 出 明确 
的 语法 分 析 树 。 因 此 , 我 们 将 研究 一 类 称 为 “L 属性 翻译 ”(L 代表 从 左 到 右 ) 的 语法 制导 翻译 方 
案 , 这 一 类 方案 实际 上 包含 了 所 有 可 以 在 语法 分 析 过 程 中 完成 的 翻译 方案 。 我 们 还 将 研究 一 个 
较 小 的 类 别 , 称 为 “S 属性 翻译 方案 ”($ 代表 综合 ) , 这 类 方案 可 以 很 容易 地 和 自 底 向 上 语法 分 析 
过 程 联系 起 来 。 


5. 1 语法 制导 定义 


语法 制导 定义 (Syntax-Directed Definition,SDD) 是 一 个 上 下 文 无 关 文 法 和 属性 及 规则 的 结合 。 
属性 和 文法 符号 相关 联 , 而 规则 和 产生 式 相 关联 。 如 果 匀 是 一 个 符号 而 a 是 的 一 个 属性 , 那么 
我 们 用 X. a 来 表示 a 在 某 个 标号 为 X 的 分 析 树 结 点 上 的 值 。 如 果 我 们 使 用 记录 或 对 象 来 实现 这 
个 语法 分 析 树 的 结 点 , 那么 X 的 属性 可 以 被 实现 为 代表 了 的 结 点 的 记录 的 数据 字段 。 属 性 可 以 
”有 多 种 类 型 ， 比 如 数字 、 类 型 、 表 格 引用 或 串 。 这 些 串 甚至 可 能 是 很 长 的 代码 序列 ， 比 如 编译 器 
使 用 的 中 间 语 言 的 代码 。 
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5.1.1 继承 属性 和 综合 属性 

我 们 将 处 理 非 终结 符号 的 两 种 属性 : 

1) 综合 属性 (synthesized attribute) : 在 分 析 树 结 点 N 上 的 非 终结 符号 4 的 综合 属性 是 由 六 上 
的 产生 式 所 关联 的 语义 规则 来 定义 的 。 请 注意 , 这 个 产生 式 的 头 一 定 是 4。 结 点 Y 上 的 综合 属性 
只 能 通过 WN 的 子 结 点 或 W 本 身 的 属性 值 来 定义 。 

2) 继承 属性 (inherited attribute) : 在 分 析 树 结 点 NV 上 的 非 终结 符号 B 的 继承 属性 是 由 的 父 
结 点 上 的 产生 式 所 关联 的 语义 规则 来 定义 的 。 请 注意 , 这 个 产生 式 的 体 中 必然 包含 符号 B。 结 点 
N 上 的 继承 属性 只 能 通过 NN 的 父 结 点 、N 本 身 和 的 兄弟 结 点 上 的 属性 值 来 定义 。 





另 一 种 定义 继承 属性 的 方法 
即使 我 们 允许 结 点 N 上 的 一 个 继承 属性 B.c 通过 N 的 子 结 点 、 NN 本 身 、N 的 父 结 点 和 兄 
弟 结 点 上 的 属性 值 来 定义 , 我 们 可 以 定义 的 翻译 的 种 类 并 不 会 增加 。 这 样 的 规则 可 以 通过 创 
建 附加 的 B 的 属性 ,比如 B. cl、B. cs、… 来 模拟 。 这 些 都 是 综合 属性 ， 用 于 把 标号 为 8 的 结 
点 的 子 结 点 上 的 属性 拷贝 过 来 。 然 后 , 我 们 使 用 属性 B.c1、B. c2、 … 来 替换 子 结 点 属性 , 按照 
继承 属性 的 方法 计算 得 到 B.c。 在 实践 中 很 少 需 要 这 种 属性 。 | 











我 们 不 允许 结 点 W 上 的 继承 属性 通过 N 的 子 结 点 上 的 属性 值 来 定义 ,但 是 我 们 允许 结 点 Y 
上 的 一 个 综合 属性 通过 结 点 N 本 身 的 继承 属性 来 定义 。 

终结 符号 可 以 具有 综合 属性 , 但 是 不 能 有 继承 属性 。 终 结 符号 的 属性 值 是 由 词法 分 析 器 提 
供 的 词法 值 , 在 SDD 中 没有 计算 终结 符号 的 属性 值 的 语义 规则 。 
图 5.1 中 的 SDD 基于 我 们 熟悉 的 带 有 运算 符 * 和 + 的 算术 表达 式 文法 。 它 对 一 个 以 n 作为 
结尾 标记 的 表达 式 求 值 。 在 这 个 SDD 中 , 每 个 非 终结 符号 具有 唯一 的 被 称 为 val 的 综合 属性 。 我 们 同 
时 假设 终结 符号 digit 具有 一 个 综合 属性 lexval, 它 是 由 词法 分 析 器 返回 的 整数 值 。 口 

产生 式 1 LOE n 的 规则 将 二 ,zw 设置 为 E. val, 





























; 5 ; 

我 们 将 看 到 , 它 就 是 整个 表达 式 的 值 。 D es FE 
产生 式 2 EE, + 了 也 有 一 个 规则 。 它 计算 出 历 | 2) E> +T | Bval= Ey.val+Tval 

和 了 的 值 的 和 , 作为 产生 式 头 五 的 val 属性 的 值 。 在 | 3 ET B.val = T-val 

任何 标号 为 E 的 语法 分 析 树 结 点 N 上 , E 的 val 值 是 x pet fal eee 

NAF RSS EMT) LAY val 什 eT se 





的 和 。 
产生 式 3 E> 了 有 唯一 的 规则 , 它 定义 了 的 val 
值 和 对 应 于 7 的 子 结 点 的 val 值 相同 。 产 生 式 4 和 第 图 5-1 一 个 简单 的 案 上 计算 器 


F > digit F.val = digit.lexval 


二 个 产生 式 类 似 , 它 的 规则 将 子 结 点 的 值 相 乘 ， 而 不 ear 
是 相 加 。 产 生 式 5 和 6 的 规则 和 第 三 个 产生 式 的 规则 类 似 , 它们 拷贝 子 结 点 的 值 。 产 生 式 7 给 
F. val 赋予 一 个 digit 的 值 ， 即 由 词法 分 析 器 返回 的 词法 单元 digit 的 数值 。 o 


一 个 只 包含 综合 属性 的 SDD 称 为 $ 属性 (S-attribute) 的 SDD, 图 5-1 中 的 SDD 就 具有 这 个 性 
质 。 在 一 个 S 属性 的 SDD 中 , 每 个 规则 都 根据 相应 产生 式 的 产生 式 体 中 的 属性 值 来 计算 产生 式 
头 部 非 终 结 符号 的 一 个 属性 。 

为 简单 起 见 , 本 节 中 的 语义 规则 没有 副作用 。 在 实践 中 , 允许 SDD 具有 一 些 副作用 会 带 来 
一 些 方便 。 比 如 允许 打印 桌 上 计算 器 计算 得 到 的 结果 , 或 者 和 一 个 符号 表 进行 交互 。 等 到 在 5.2 
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节 中 讨论 了 属性 的 求 值 顺序 之 后 , 我 们 将 允许 语义 规则 计算 任意 的 函数 , 这些 函 数 可 能 会 有 副 
作用 。 

一 个 S$ 属性 的 SDD 可 以 和 一 个 LR 语法 分 析 器 一 起 自然 地 实现 。 实 际 上 , 图 5-1 中 的 SDD 是 
图 4-58 中 的 Yace 程序 的 另 一 种 表示 , 该 程序 演示 了 在 LR 语法 分 析 过 程 中 进行 翻译 的 过 程 。 两 
者 的 区 别 在 于 ，Yace 程序 在 产生 式 1 的 规则 中 通过 副作用 打印 了 E. val 的 值 , 而 不 是 定义 属 
PEL. valo 

一 个 没有 副作用 的 SDD 有 时 也 称 为 属性 文法 ( attribute grammar) o 一 个 属性 文法 的 规则 仅仅 
通过 其 他 属性 值 和 常量 值 来 定义 一 个 属性 值 。 
5.1.2 在 语法 分 析 树 的 结 点 上 对 SDD 求 值 

在 语法 分 析 树 上 进行 求 值 有 助 于 将 SDD 所 描述 的 翻译 方案 可 视 化 ,虽然 翻译 器 实际 上 不 需 
要 构建 语法 分 析 树 。 因 此 , 我 们 想象 一 下 在 应 用 一 个 SDD 的 规则 之 前 首先 构造 出 一 棵 语法 分 析 
树 ， 然 后 再 使 用 这 些 规则 对 这 棵 语法 分 析 树 上 的 各 个 结 点 上 的 所 有 属性 进行 求 值 。 一 个 显示 了 
它 的 各 个 属性 的 值 的 语法 分 析 树 称 为 注释 语法 分 析 树 (annotated parse tree) o 

我 们 如 何 构造 一 棵 注释 语法 分 析 树 呢 ? 我 们 按照 什么 顺序 来 计算 各 个 属性 ? 在 我 们 对 一 棵 
语法 分 析 树 的 某 个 结 点 的 一 个 属性 进行 求 值 之 前 , 必须 首先 求 出 这 个 属性 值 所 依赖 的 所 有 属性 
fi, Hein, 如 例 5.1 Bras, 所 有 的 属性 都 是 综合 属性 , 那么 在 我 们 对 一 个 结 点 上 的 val 属性 求 值 
之 前 , 必须 求 出 该 结 点 的 所 有 子 结 点 的 属性 val 的 值 。 

对 于 综合 属性 , 我 们 可 以 按照 任何 自 底 向 上 的 顺序 计算 它们 的 值 , 比如 对 语法 分 析 树 进行 后 
序 遍历 的 顺序 。 对 于 S 属性 定义 的 求 值 将 在 5. 2. 3 节 中 讨论 。 

对 于 同时 具有 继承 属性 和 综合 属性 的 SDD, 不 能 保证 有 一 个 顺序 来 对 各 结 点 上 的 属性 进行 
求 值 。 比如, 考虑 非 终结 符号 4 和 B, 它们 分 别 具 有 综合 属性 4. 和 继承 属性 Bis 同时 它们 的 
产生 式 和 规则 如 下 : 


产生 式 语义 规则 
A+B As = Bi; 
Bi=As+1 


这 些 规则 是 循环 定义 的 。 不 可 能 首先 求 出 结 点 W EAA s BRON ROP 
上 的 B.i 中 的 一 个 的 值 ,然后 再 求 出 另 一 个 的 值 。 一 棵 语法 分 析 树 的 菏 个 结 点 D a 
对 上 的 A. s 和 B.i 之 间 的 循环 依赖 关系 如 图 5-2 所 示 。 

从 计算 的 角度 看 , 给 定 一 个 SDD, 很 难 确定 是 否 存在 某 棵 语法 分 析 树 使 得 ) 
SDD 的 属性 值 之 间 具 有 循环 依赖 关系 日 。 幸 运 的 是 , 存在 一 个 SDD 的 有 用 子 SQ m 
类 , 它们 能 够 保证 对 每 棵 语法 分 析 树 都 存在 一 个 求 值 顺序 。 我 们 将 在 5. 2 节 中 roe 
介绍 这 类 SDD, 

图 5-3 显示 了 一 个 对 应 于 输入 串 3 * 5 +4n 的 注释 语法 分 析 树 ; 该 图 52 4.s 和 B.i 
分 析 树 是 利用 图 5-1 的 文法 和 规则 构造 得 到 的 。 我 们 假定 lexval 的 值 由 词法 分 “之 间 的 循环 依赖 

析 器 提供 。 对 应 于 非 终结 符号 的 每 个 结 点 都 有 一 个 按 自 底 向 上 顺序 计算 得 到 的 val 属性 。 在 图 中 
我 们 可 以 看 到 每 个 结 点 都 关联 了 一 个 结果 值 。 比 如 , 在 图 中 结 点 * 的 父 结 点 上 ， 当 计算 得 到 它 的 
第 一 和 第 三 个 子 结 点 上 的 7.val =3 A F. val =5 之 后 , 我 们 应 用 了 相应 的 规则 , 指明 T. val 就 是 这 


O 简单 地 讲 ,虽然 这 个 问题 是 可 判定 的 ,但 即使 罗 =.MB 成 立 ， 它 也 不 可 能 使 用 多 项 式 时 间 的 算法 来 求解 ， 因 为 它 具 
有 指数 的 时 间 复 杂 性 。 
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两 个 值 的 乘积 , 即 15。 加 
当 一 标语 法 分 析 树 的 结构 和 源 代码 的 抽象 语法 不 “匹配 ”时 , 继承 属性 是 很 有 用 的 。 因 为 文 


法 不 是 为 了 翻译 而 定义 的 , 而 是 以 语法 分 析 为 目的 进行 定义 的 , 因此 可 能 会 产生 这 种 不 匹配 的 情 
况 。 下 面 的 例子 显示 了 如 何 使 用 继承 属性 来 解决 这 个 间 题 。 


L.val= 19 
E.val= 19 n 


E.val= 15 + T.val = 4 


T.val = 15 F.val=4 


ae | 


T.val = 3 * F.val=5 digit.lerval = 4 
F.val = 3 digit lezval = 5 


digit.lerval = 3 
图 5-3 3*5 +4n 的 注释 语法 分 析 树 


图 5-4 中 的 SDD 计算 诸如 3 * 5 和 3*5*7 这 样 的 项 。 处 理 输入 3 *5 的 自 顶 向 下 语法 
分 析 过 程 首先 使 用 了 产生 式 TFT’, 这 里 , 下 生成 了 数位 3, 但 是 运算 符 * 由 2 生成 5 因此 , £ 
运算 分 量 3 和 运算 符 * 位 于 不 同 的 子 树 中 。 我 们 将 使 用 一 个 继承 属性 来 把 这 个 运算 分 量 传递 给 
运算 符 * 。 

这 个 例子 中 的 文法 摘自 常见 的 表达 式 文法 的 无 左 递归 版 本 , 我 们 在 4. 4 节 中 使 用 这 个 文法 作 
为 说 明 自 顶 向 下 语法 分 析 的 例子 。 

非 终结 符号 了 和 下 各 自 有 一 个 综合 属性 val, 终 
结 符号 digit 有 一 个 综合 属性 lexvals 非 终结 符号 7' 具 
有 两 个 属性 : 继承 属性 inh 和 综合 属性 syno 

这 些 语义 规则 基于 如 下 思想 : 运算 符 * 的 左 运算 
分 量 是 通过 继承 得 到 的 。 更 准确 地 说 , 产生 式 了 一 
* TF! 的 头 T' 继 承 了 产生 式 体 中 * 的 左 运算 分 量 。 给 
定 一 个 项 %*y*z, 对 应 于 *y*z 的 子 树 的 根 结 点 继 
承 了 x 的 值 。 对 应 于 * z 的 子 树 的 根 结 点 继承 了 x *y 
的 值 。 如 果 项 中 还 有 更 多 的 因子 , 我 们 可 以 继续 这 样 
的 处 理 过 程 。 当 所 有 的 因子 都 处 理 完毕 后 , 这 个 结果 
就 通过 综合 属性 向 上 传递 到 树 的 根部 。 

为 了 了 解 如 何 使 用 这 些 语义 规则 , 考虑 图 5-5 中 对 应 于 3 * 5 的 注释 语法 分 析 树 。 这 棵 语法 
分 析 树 中 最 左边 的 标号 为 digit 的 叶子 结 点 具有 属性 值 lexval =3, 其 中 的 3 是 由 词法 分 析 器 提供 
的 。 它 的 父 结 点 对 应 于 产生 式 4, 即 天 *digit。 和 这 个 产生 式 相关 的 唯一 语义 规则 定义 已 vol = 
digit. lexval, FF 3. 


语义 规则 
T' inh = F.val 
T.val = T' syn 
Ti -inh = T'.inh x F.val 
T' syn = Tj.syn 
T'.syn =T'.inh 

















To FT' 





T'>*FT] 


T'e 








F + digit F.val = digit.lezval 


图 5-4 一 个 基于 适用 于 自 顶 向 
下 语法 分 析 的 文法 的 SDD 
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在 根 结 点 的 第 二 个 子 结 点 上 ,继承 属性 了 inh 根 据 和 产生 式 1 关联 的 语义 规则 7T".inh =F. val 定义 。 
因此 , 运算 符 * 的 左 运算 分 量 3 从 根 结 点 的 左 子 结 点 传递 到 右 子 结 点 。 

对 应 于 T' 的 结 点 的 产生 式 是 T'— * FT1。 T.val = 15 
(我 们 保留 了 注释 语法 分 析 树 中 的 下 标 1， 以 
区 分 树 中 的 两 个 7' 结 点 。) 继承 属性 T1 inh 是 Fval <3 een = 
由 语义 规则 T). inh = T’. inh x F. val 定义 的 ， 
这 个 规则 和 产生 式 2 相关 联 。 

ELA T’. inh =3 H F. val =5, 我 们 得 到 
Ti. inh = 15。 在 层次 较 低 的 71 结 点 上 的 产生 
RE T'e, MMR T. syn = T. inh 
定义 了 TI. syn =15。 各 个 TR EAE syn BSS 3 *5 RATHI 
将 值 15 沿 着 树 向 上 传递 到 了 结 点 , 使 得 了 vol = 15, 回 
5.1.3 5.1 节 的 练习 

练习 5. 1.1: 对 于 图 5-1 中 的 SDD, 给 出 下 列表 达 式 对 应 的 注释 语法 分 析 树 : 

1) (3+4) * (5+6)n 

2) 1#2*3%(4+5)n 

3) (9+8*(7+6) +5) *4n 

练习 5.1.2: 扩展 图 5-4 中 的 SDD, 使 它 可 以 像 图 5-1 所 示 的 那样 处 理 表 达 式 。 

练习 5. 1. 3: 使 用 你 在 练习 5.1.2 中 得 到 的 SDD, 重复 练习 5.1.1。 


5.2 SDD 的 求 值 顺序 


依赖 图 (dependency graph) 是 一 个 有 用 的 工具 , 它 可 以 确定 一 棵 给 定 的 语法 分 析 树 中 各 个 属 
性 实例 的 求 值 顺 序 。 注 释 语法 分 析 树 显示 了 各 个 属性 的 值 , 而 依赖 图 可 以 帮助 我 们 确定 如 何 计 
算 这 些 值 。 

在 本 节 中 , 除了 依赖 图 , 我 们 还 定义 了 两 类 重要 的 SDD; “S 属性 ”SDD 和 更 加 通用 的 “L 属性 ” 
SDD, 使 用 这 两 类 SDD 描述 的 翻译 方案 可 以 和 我 们 已 经 研究 过 的 语法 分 析 方法 很 好 地 结合 在 一 起 。 并 
且 在 实践 中 遇 到 的 大 部 分 翻译 方案 可 以 按照 这 两 类 SDD 中 的 至 少 一 类 的 要 求 写 出 来 。 

5.2.1 依赖 图 

依赖 图 描述 了 某 个 语法 分 析 树 中 的 属性 实例 之 间 的 信息 流 。 从 一 个 属性 实例 到 另 一 个 实例 
的 边 表示 计算 第 二 个 属性 实例 时 需要 第 一 个 属性 实例 的 值 。 图 中 的 边 表示 语义 规则 所 蕴涵 的 约 
束 。 更 详细 地 说 : 

。 对 于 每 个 语法 分 析 树 的 结 点 ,比如 一 个 标号 为 文法 符号 X 的 结 点 , 和 XX 关联 的 每 个 属性 

都 在 依赖 图 中 有 一 个 结 点 。 

。 假设 和 产生 式 p 关联 的 语义 规则 通过 蕊 ec 的 值 定义 了 综合 属性 4.5 的 值 (这 个 规则 定义 
4.5 时 可 能 还 用 到 了 XX < 之 外 的 其 他 属性 )。 那 么 , 相应 的 依赖 图 中 有 一 条 从 < 到 4.8 
的 边 。 更 准确 地 讲 , 在 每 个 标号 为 4 且 应 用 了 产生 式 p WEAN E, 创建 一 条 从 该 产生 
式 体 中 的 符号 X 的 实例 所 对 应 的 NN 的 子 结 点 上 的 属性 < 到 和 NN 上 的 属性 5 的 边 。9 


Ti.inh= 15 
digit.lerval = 3 * F.val = 5 Ti yn =15 


digit .lezval = 5 < 


O ”因为 一 个 结 点 W 可 能 有 多 个 标号 为 X 的 子 结 点 , 我 们 再 次 假设 使 用 下 标 来 区 分 同一 个 符号 在 这 个 产生 式 的 不 同 
位 置 上 的 多 次 使 用 。 
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。 假设 和 产生 式 p 关联 的 一 个 语义 规则 通过 XX a 的 值 定义 了 继承 属性 B. c 的 值 。 那 么 , 在 
相应 的 依赖 图 中 有 一 条 从 于 a 到 B. c 的 边 。 对 于 每 个 标号 为 B、 对 应 于 产生 式 中 的 这 
个 8 的 结 点 NN, 创建 一 条 从 结 点 M 上 的 属性 a 到 入 上 的 属性 。 的 边 。 这 里 的 作对 应 于 这 
个 X。 请 注意, 必 可 以 是 入 的 父 结 点 或 者 兄弟 结 点 。 
考虑 下 面 的 产生 式 和 规则 : 
产生 式 语义 规则 
五 一 百 +T Eval = Ey.val + T.val 
在 每 个 标号 为 , 目 其 子 结 点 对 应 于 这 个 产生 式 体 的 结 点 W E, N 上 的 综合 属性 val 使 用 两 
个 子 结 点 (标号 分 别 为 已 和 7) 上 的 val 值 计 算得 到 。 因 此 ,对 于 每 个 使 用 了 这 个 产生 式 的 语法 分 
析 树 , 该 树 的 依赖 图 中 有 一 部 分 如 图 5-6 所 示 。 作 为 惯例 , 我 们 将 把 语法 分 析 树 的 边 显示 为 虚 
R, 而 依赖 图 的 边 显示 为 实 线 。 口 
DEJ 一 个 完整 的 依赖 图 的 例子 如 图 5-7 所 示 。 这 个 依赖 
图 的 结 点 用 数字 1 ~9 表示 , 对 应 于 图 5-5 中 的 注释 语法 分 析 we 
树 中 的 各 个 属性 ' ai 
结 点 1 和 2 表示 和 其 标号 为 digit 的 两 个 叶子 结 点 相关 联 
的 属性 lorwal。 结 点 3 和 4 表示 和 其 标号 为 的 两 个 结 点 相关 。。 5 E oa h E oal A 
联 的 属性 val。 从 结 点 1 到 结 点 3 的 边 , 以 及 从 结 点 2 到 结 点 4 A 
的 边 是 根据 通过 SDD 中 digit. lewal 定义 F. val 的 语义 规则 得 到 的 。 实 际 上 , F. val 等 于 
digit. lewal, 但 依赖 图 中 的 边 表示 的 是 依赖 关系 ， 而 不 是 等 于 关系 。 
结 点 5 和 6 表示 和 非 终结 符号 了 的 Lia i 
各 次 出 现 相关 联 的 继承 属性 7'. inho M a 
结 点 3 到 结 点 5 的 边 是 根据 规则 Tinh=2 op STS 
F. val 得 到 的 , 这 个 规则 根据 根 的 左 子 结 。 “: a 
点 上 的 Rel PLT HPSALEM dipti tena 
T'. inhs 我 们 看 到 了 从 结 点 5 到 结 点 6 的 : 
代表 7". inh 的 边 和 从 结 点 4 到 结 点 5 的 de 








代表 F. val 的 边 , 因为 这 两 个 值 相 乘 后 得 oe 
到 了 结 点 6 上 的 属性 inh 的 值 。 图 5-7 对 应 于 图 5-5 中 的 注释 语法 分 析 树 的 依赖 图 


结 点 7 和 8 表示 了 和 和 的 各 次 出 现 相 关联 的 综合 属性 syn。 从 结 点 6 到 结 点 7 的 边 是 根据 图 
5-4 中 的 产生 式 3 所 关联 的 规则 7’. syn = 7". inh 得 到 的 。 从 结 点 7 到 结 点 8 的 边 是 根据 产生 式 2 
所 关联 的 语义 规则 得 到 的 。 

最 后 , 结 点 9 表示 属性 T. valo MAR 8 到 结 点 9 的 边 是 根据 产生 式 1 所 关联 的 语义 规则 
T. val = T”. syn 而 得 到 的 。 E 
5.2.2 属性 求 值 的 顺序 

依赖 图 刻画 了 对 一 棵 语法 分 析 树 中 不 同 结 点 上 的 属性 求 值 时 可 能 采取 的 顺序 。 如 果 依 赖 图 
中 有 一 条 从 结 点 M 到 结 点 N 的 边 , 那么 要 先 对 M 对 应 的 属性 求 值 , 再 对 N 对 应 的 属性 求 值 。 因 
此 , 所 有 的 可 行 求 值 顺 序 就 是 满足 下 列 条 件 的 结 点 顺序 N a Man Ny: 如 果 有 一 条 从 结 点 W; 到 
N; 的 依赖 图 的 边 , 那么 i<j。 这 样 的 排序 将 一 个 有 向 图 变 成 了 一 个 线性 排序 , 这 个 排序 称 为 这 个 
图 的 拓扑 排序 (topological sort) 。 
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如 果 这 个 图 中 存在 任意 一 个 环 , 那么 就 不 存在 拓扑 排序 。 也 就 是 说 ; 没有 办 法 在 这 棵 语法 分 
析 树 上 对 相应 的 SDD 求 值 ; 然而 , 如果 图 中 没有 环 ， 那么 总 是 至 少 存在 一 个 拓扑 排序 。 下 面 说 
明 一 下 为 什么 会 存在 拓扑 排序 。 因 为 没有 环 ， 所 以 我 们 一 定 能 够 找到 一 个 没有 边 进入 的 结 点 。 
假设 没有 这 样 的 结 点 , 那么 我 们 就 可 以 不 断 地 从 一 个 前 驱 结 点 到 达 另 一 个 前 驱 结 点 ,直到 我 们 回 
到 某 个 已 经 访问 过 的 结 点 , 从 而 形成 了 一 个 环 。 令 这 个 没有 进入 边 的 结 点 为 拓扑 排序 的 第 二 个 
结 点 , 从 依赖 图 中 删除 这 个 点 ,并 对 其 余 的 结 点 重复 上 面 的 过 程 。( 最终 就 可 以 得 到 一 个 拓扑 排 
序 一 一 译 者 注 。) 
图 5-7 中 的 依赖 图 没有 环 。 它 的 拓扑 排序 之 一 是 这 些 结 点 的 编码 的 顺序 : 12, 、9。 
请 注意 , 这 个 图 的 每 条 边 都 是 从 编号 较 低 的 结 点 指向 编号 较 高 的 结 点 , 因此 这 个 排序 一 定 是 拓扑 
排序 。 还 有 其 他 的 拓扑 排序 , 比如 1、3、5、2、4、6、7、8、9。 口 
5.2.3 S 属性 的 定义 

前 面 提 到 过 , 给 定 一 个 SDD, 很 难 判定 是 否 存在 一 棵 其 依赖 图 包含 环 的 语法 分 析 树 。 在 实践 
中 , 翻译 过 程 可 以 使 用 某 些 特定 类 型 的 SDD 来 实现 。 这 些 类 型 的 SDD 一 定 有 一 个 求 值 顺 序 ， 因 
为 它们 不 允许 产生 带 有 环 的 依赖 图 。 不 仅 如 此 ,这 一 节 中 介绍 的 两 类 SDD 可 以 和 自 项 向 下 及 自 
底 向 上 的 语法 分 析 过 程 一 起 高 效 地 实现 。 

第 一 种 SDD 类 型 的 定义 如 下 ; 

。 如 果 一 个 SDD 的 每 个 属性 都 是 综合 属性 ， 它 就 是 $ 属性 的 。 
DEE s-i 中 的 spp 是 一 个 $ 属 性 定义 的 例子 。 其 中 的 每 个 属性 (L. val, E val, T. val 和 
.val) 都 是 综合 属性 。 口 

如 果 一 个 SDD 是 S 属性 的 , 我 们 可 以 按照 语法 分 析 树 结 点 的 任何 自 底 向 上 顺序 来 计算 它 的 
各 个 属性 值 。 对 语法 分 析 树 进行 后 序 遍历 并 对 属性 求 值 常常 会 非常 简单 ， 当 遍历 最 后 一 次 离开 
某 个 结 点 Y 时 计算 出 -W 的 各 个 属性 值 。 也 就 是 说 , 我们 可 以 把 下 面 定义 的 函数 postorder 应 用 到 
语法 分 析 树 的 根 上 ( 见 2. 3. 4 节 中 的 “前 序 遍历 和 后 序 遍历 "部 分 ) ; 

postorder( N) 

{for( 从 左边 开始 ,对 WN 的 每 个 子 结 点 C)postorder( C) ; 

对 入 关联 的 各 个 属性 求 值 : 

} 

S 属性 的 定义 可 以 在 自 底 向 上 语法 分 析 的 过 程 中 实现 ,因为 一 个 自 底 向 上 的 语法 分 析 过 程 对 
应 于 一 次 后 序 遍历 。 特 别 地 , 后 序 顺序 精确 地 对 应 于 一 个 LR 分 析 器 将 一 个 产生 式 体 归 约 成 为 它 
的 头 的 过 程 。 这 个 性 质 将 在 5. 4. 2 节 中 用 于 LR 语法 分 析 过 程 中 的 综合 属性 求 值 工作 , 这 些 值 将 
存放 在 分 析 栈 中 。 这 个 过 程 不 会 显 式 地 创建 语法 分 析 树 的 结 点 。 
5.2.4 上 属性 的 定义 

第 二 种 SDD 称 为 工 属性 定义 (L-attributed definition) 。 这 类 SDD 的 思想 是 在 一 个 产生 式 体 所 
关联 的 各 个 属性 之 间 , 依赖 图 的 边 总 是 从 左 到 右 ， 而 不 能 从 右 到 左 ( 因 此 称 为 工 属性 的 ) 。 更 准 
确 地 讲 , 每 个 属性 必须 要 么 是 

。 一 个 综合 属性 , BAR 

”一 个 继承 属性 , 但 是 它 的 规则 具有 如 下 限制 。 假 设 存在 一 个 产生 式 4_X,X%...X,， 并且 

有 一 个 通过 这 个 产生 式 所 关联 的 规则 计算 得 到 的 继承 属性 Xi. as。 那 么 这 个 规则 只 能 
使 用 : 
1) 和 产生 式 头 4 关联 的 继承 属性 。 
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2) MF X; 左边 的 文法 符号 实例 XI、X。、…、Xi 1 相关 的 继承 属性 或 者 综合 属性 。 
3) 和 这 个 X; 的 实例 本 身 相关 的 继承 属性 或 综合 属性 , 但 是 在 由 这 个 X; 的 全 部 属性 组 成 的 
依赖 图 中 不 存在 环 。 
例 5.8 5-4 中 的 SDD 是 工 属 性 的 。 要 知道 为 什么 , 考虑 对 应 于 继承 属性 的 语义 规则 。 为 方 
便 起 见 , 我 们 在 这 里 再 重复 一 下 这 些 规则 : 
产生 式 语义 规则 
T> FT T'.inh = F.val 
T'=>*FT]į TI.inh= T".inh x F.val 
其 中 的 第 一 个 规则 定义 继承 属性 7' inh 时 只 使 用 了 F. val, 且 下 在 相应 产生 式 体 中 出 现在 7 的 左 
部 , 因此 满足 工 属 性 的 要 求 。 第 二 个 规则 定义 T’: inh 时 使 用 了 和 产生 式 头 相关 联 的 继承 属性 
7'.inh 及 F.wval, 其 中 在 这 个 产生 式 体 中 出 现在 1" 的 左边 。 
从 语法 分 析 树 的 角度 看 , 在 每 一 种 情况 中 , 当 这 些 规 则 被 应 用 于 某 个 结 点 时 , 它 使 用 的 信息 
“来 自 于 上 边 或 左边 ”的 语法 树 结 点 , 因此 满足 这 一 类 SDD 的 要 求 。 其 余 的 属性 是 综合 属性 ， 因 


此 这 个 SDD 是 工 属性 的 。 m 
任何 包含 下 列 产生 式 和 规则 的 SDD 都 不 是 工 属性 的 : 
产生 式 语义 规则 
A+BC A.s = B.b; 
B.i = f(C.c, As) 


第 一 个 规则 4.s =B. b Æ S 属性 SDD 或 工 属性 SDD 中 都 是 一 个 合法 的 规则 。 它 通过 一 个 子 结 点 
(也 就 是 产生 式 体 中 的 一 个 符号 ) 的 属性 定义 了 综合 属性 4.s。 
第 二 个 规则 定义 了 一 个 继承 属性 B. i, 因此 整个 SDD 不 可 能 是 $ 属性 的 。 不 仅 如 此 , 虽然 这 
个 规则 是 合法 的 , 这 个 SDD 也 不 可 能 是 工 属 性 的 , 因为 属性 C. c 用 来 定义 B.i, 并 且 C 在 产生 式 
体 中 位 于 B 的 右边 。 虽 然 在 工 属性 的 SDD 中 可 以 使 用 语法 分 析 树 中 的 兄弟 结 点 的 属性 , 但 这 些 
结 点 必须 位 于 被 定义 属性 的 符号 的 左边 。 0 
5.2.5 具有 受 控 副 作用 的 语义 规则 
在 实践 中 ,翻译 过 程 会 出 现 一 些 副 作用 : 一 个 桌 上 计算 器 可 能 打印 出 一 个 结果 ; 一 个 代码 生 
成 器 可 能 把 一 个 标识 符 的 类 型 加 入 到 符号 表 中 。 对 于 SDD, 我 们 在 属性 文法 和 翻译 方案 之 间 找 
到 了 一 个 平衡 点 。 属 性 文法 没有 副作用 , 并 支持 任何 与 依赖 图 一 致 的 求 值 顺 序 。 翻 译 方案 要 求 
按 从 左 到 右 的 顺序 求 值 , 并 允许 语义 动作 包含 任何 程序 片段 。 翻 译 方案 将 在 5.4 节 中 讨论 。 
我 们 将 按照 下 面 的 方法 之 一 来 控制 SDD 中 的 副作用 : 
e 支持 那些 不 会 对 属性 求 值 产生 约束 的 附带 副作用 。 换 句 话 说, 如 果 按 照 依赖 图 的 任何 拓 
扑 顺序 进行 属性 求 值 时 都 可 以 产生 “正确 的 ”翻译 结果 , 我 们 就 允许 副作用 存在 。 这 里 的 
“正确 ?要 视 具 体 应 用 而 定 。 
© 对 人 允许 的 求 值 顺序 添加 约束 ,使 得 以 任何 允许 的 顺序 求 值 都 会 产生 相同 的 翻译 结果 。 这 
些 约束 可 以 被 看 作 隐 含 加 入 到 依赖 图 中 的 边 。 
作为 附带 副作用 的 一 个 例子 , 让 我 们 修改 例 5. 1 的 桌 上 计算 器 , 使 它 打 印 出 计算 结果 。 我 们 
不 使 用 规则 L val = E. val, 这 个 规则 将 结果 保存 到 综合 属性 Lval 中 。 我 们 考虑 : 
产生 式 语义 规则 
1) L—En print( E. val) 
像 print( E. val) 这 样 的 语义 规则 的 目的 就 是 执行 它们 的 副作用 。 它 们 将 会 被 看 作 与 相应 产生 式 头 
相关 的 哑 综 合 属性 的 定义 。 这 个 经 过 修改 的 SDD 在 任何 拓扑 顺序 下 都 能 产生 相同 的 值 , 因为 这 
个 打印 语句 在 结果 被 计算 到 E. val 中 之 后 才 会 被 执行 。 
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Hien E 5-8 中 的 SDD 处 理 了 简单 的 声明 D。 该 声明 中 包含 一 个 基本 类 型 7, 后 跟 一 个 标识 
符 列表 LK。7 的 类 型 可 以 是 int 或 float。 对 于 列表 中 的 每 个 标识 符 , 这 个 类 型 被 录入 到 标识 符 的 
符号 表 条 目 中 。 我 们 假设 录入 一 个 标识 符 的 类 型 不 会 影响 其 他 标识 符 对 应 的 符号 表 条 目 。 这 样 ， 
这 些 条 目 可 以 按照 任何 顺序 进行 更 新 。 这 个 SDD 不 会 检查 一 个 标识 符 是 否 被 声明 了 多 次 , RN 
也 可 以 修改 这 个 SDD, 使 它 能 够 对 标识 符 声明 次 数 进行 检查 。 


非 奖 结 符号 有 表示 了 一 个 声明 。 粮 所 产生 式 1 一 
= 
可 知 , 这 个 声明 包含 一 个 类 型 7, 后 跟 一 个 标识 符 的 oe 





DATL L.inh = T.type 
列表 。T 有 一 个 属性 工 type, 它 是 声明 D 中 的 类 型 。 T = int T..type = integer 
FAAR LANCE, RREA inh, 以 强 T + float T.type = float 
调 它 是 一 个 继承 属性 。L. inh 的 作用 是 将 声明 的 类 |I T27 Dihed 
型 沿 着 标识 符 列表 向 下 传递 , 使 得 它 可 以 被 加 入 到 Lid addType(id.entry, L.inh) 


相应 的 符号 表 条 目 中 。 

产生 式 2 和 产生 式 3 都 计算 综合 属性 Tiype, 为 。 图 5-8 简单 类 型 声明 的 语法 制导 定义 
它 赋予 正确 的 值 : integer 或 oat。 这 个 类 型 值 在 产生 式 1 的 规则 中 被 传递 给 属性 二 inho PERA 
Hf L. inh 沿 着 语法 分 析 树 向 下 传递 。 也 就 是 说 , 在 一 个 分 析 树 结 点 上 , (AL. inh 是 通过 拷贝 该 结 
点 的 父 结 点 的 工 . inh 值 而 得 到 的 , 这 个 父 结 点 对 应 于 此 产生 式 的 头 。 

产生 式 4 和 产生 式 5 还 包含 另 一 个 规则 。 该 规则 用 如 下 两 个 参数 调用 函数 addType: 

© id. entry; 在 词法 分 析 过 程 中 得 到 的 一 个 指向 某 个 符号 表 对 象 的 值 。 

o L. inh; 被 赋 给 列表 中 各 个 标识 符 的 类 型 值 。 

我 们 假设 函数 addType 正确 地 将 id 所 代表 的 标识 符 的 类 型 设置 为 类 型 值 .ii。 

输入 串 float id, ,ia , id; 的 依赖 图 如 图 5-9 所 示 。 数 字 1 ~ 10 表示 了 这 个 依赖 图 中 的 结 点 。 
结 点 1、2 和 3 表示 了 和 各 个 标号 为 id 的 叶子 结 点 相关 的 属性 eniry。 结 点 6、8 和 10 是 表示 函数 
addType 的 应 用 于 一 个 类 型 和 这 些 entry 值 之 一 的 哑 属 性 。 

结 点 4 表示 属性 T. ype, 它 实际 上 是 属 ki 
性 求 值 过 程 开始 的 地 方 。 然 后 , 这 个 类 型 被 zh 
传递 到 结 点 5、7 和 9。 这 些 结 点 表示 和 非 终 


oe e ini a 
结 符号 的 各 次 出 现 相关 的 L.inh。 O iia ae 
5.2.6 5.2 节 的 练习 float mya , ea 3 entry 


练习 5.2.1: 图 527 中 的 依赖 图 的 全 ai 

部 拓扑 排序 有 哪些 ? 
练习 5. 2. 2: 对 于 图 5-8 中 的 SDD, 给 ma g gedit tings 

出 下 列表 达 式 对 应 的 注释 语法 分 析 树 ， 


T) inka, € id; 1 entry 


L “10 entry 
fecal 


2) float W X, y, Z 

练习 5. 2.3: 假设 我 们 有 一 个 产生 式 
4 一 BCD。4、B3、(C、 也 这 四 个 非 终结 符号 都 有 两 个 属性 : s 是 一 个 综合 属性 , 而 i 是 一 个 继承 属 
性 。 对 于 下 面 的 每 组 规则 , 指出 (i) 这 些 规则 是 否 满 足 S 属性 定义 的 要 求 。(ii) 这 些 规则 是 否 满 
足 工 属性 定义 的 要 求 。( 这 ) 是 否 存在 和 这 些 规 则 一 致 的 求 值 过 程 ? 

DAs S Bitta 

AAs Biv CsA tls Ai ERS 


Æ 5-9 声明 float id,, id,, id, 的 依赖 图 
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3) Aisi =) Bis! + Des 
VAY (AS = DBs Als ences; CS B.s#D.i = Bi + Ci 
| 练习 5. 2. 4: 这 个 文法 生成 了 含 “ 小 数 点 "的 三 进 制 数 : 

ewe ais 


L>LB|B 
B=>0|1 


设计 一 个 工 属 性 的 SDD 来 计算 5. val, 即 输 入 串 的 十 进 制 数 值 。 比 如 , $ 101.11 应 该 被 翻译 
为 十 进 制 数 5. 635。 提 示 : 使 用 一 个 继承 属性 元 side 来 指明 一 个 二 进 制 位 在 小 数 点 的 哪 一 边 。 

11 练习 5. 2. 5: 为 练习 5. 2.4 中 描述 的 文法 和 翻译 设计 一 个 S 属 性 的 SDD。 

11 练习 5. 2. 6: 使 用 一 个 自 顶 向 下 语法 分 析 文法 上 的 工 属性 SDD 来 实现 算法 3.23。 这 个 算 
法 把 一 个 正则 表达 式 转换 为 一 个 不 确定 的 有 穷 自 动机 。 假 设 有 一 个 表示 任意 字符 的 词法 单元 
char, 并且 char. lexval 是 它 所 表示 的 字符 。 你 可 以 假设 存在 一 个 函数 newl ), 该 函数 返回 一 个 新 
的 状态 , 也 就 是 一 个 之 前 尚未 被 这 个 函数 返回 的 状态 。 使 用 任何 方便 的 表示 方式 来 描述 这 个 
NFA 的 翻译 。 


5.3 ”语法 制导 翻译 的 应 用 


本 章 中 的 语法 制导 的 翻译 技术 将 在 第 6 章 中 用 于 类 型 检查 和 中 间 代 码 生成 。 这 里 , 我 们 将 给 
出 一 些 例子 来 解释 有 代表 性 的 SDD。 

本 节 中 的 主要 应 用 是 抽象 语法 树 的 构造 。 因 为 有 些 编译 器 使 用 抽象 语法 树 作为 一 种 中 间 表 
RER, 所 以 一 种 常见 的 SDD 形式 将 它 的 输入 串 转换 为 一 棵 树 。 为 了 完成 到 中 间 代 码 的 翻译 ， 
编译 器 接 下 来 可 能 使 用 一 组 规则 来 编译 这 棵 语法 树 。 这 些 规则 实际 上 是 一 个 建立 于 语法 树 之 上 
的 SDD, 而 通常 的 SDD 建立 于 语法 分 析 树 之 上 。( 第 6 章 将 讨论 应 用 一 个 SDD 来 生成 中 间 代 码 的 
方法 , 这 个 方法 不 需要 显 式 地 生成 树 。) 

我 们 考虑 两 个 为 表达 式 构造 语法 树 的 SDD。 第 一 个 是 一 个 S 属性 定义 , 它 适 合 在 自 底 向 上 语 
法 分 析 过 程 中 使 用 。 第 二 个 是 一 个 工 属性 定义 , 它 适合 在 自 项 向 下 的 语法 分 析 过 程 中 使 用 。 

本 节 的 最 后 一 个 例子 是 一 个 处 理 基本 类 型 和 数组 类 型 的 工 属 性 定义 。 

5.3.1 ”抽象 语法 树 的 构造 

2. 8. 2 节 讨论 过 , 一 棉 语法 树 中 的 每 个 结 点 代表 一 个 程序 构造 ,这 个 结 点 的 子 结 点 代表 这 个 
构造 的 有 意义 的 组 成 部 分 。 表 示 表 达 式 E +E, 的 语法 树 结 点 的 标号 为 + ， 且 两 个 子 结 点 分 别 代 
表 子 表达 式 El A Ezo 

我 们 将 使 用 具有 适当 数量 的 字段 的 对 象 来 实现 一 棵 语法 树 的 各 个 结 点 。 每 个 对 象 将 有 一 个 
op 字段 ,也 就 是 这 个 结 点 的 标号 。 这 些 对 象 将 具有 如 下 所 述 的 其 他 字段 

。 如 果 结 点 是 一 个 叶子 ,那么 对 象 将 有 -一个 附加 的 域 来 存放 这 个 叶子 结 点 的 词法 值 。 构 造 

函数 Leaf( op, val) 创建 一 个 时 子 对 象 。 我 们 也 可 以 把 结 点 看 作 记录 , 那么 Leaf 就 会 返回 
一 个 指向 与 叶子 结 点 对 应 的 新 记录 的 指针 。 
。 如 果 结 点 是 内 部 结 点 , 那么 它 的 附加 字段 的 个 数 和 该 结 点 在 语法 树 中 的 子 结 点 个 数 相同 。 
构造 函数 Node 带 有 两 个 或 多 个 参数 : Node( op, c1, 625, c), 该 函数 创建 一 个 对 象 , 第 
一 个 字段 的 值 为 op, HR k 个 字段 的 值 为 CI， Cko 
DEI 图 5-10 PHS 属性 定义 为 一 个 简单 的 表达 式 文法 构造 出 语法 树 。 这 个 文法 只 包含 二 
目 运算 符 + 和 - 。 通 常 , 这 两 个 运算 符 具有 相同 的 优先 级 , 并 且 都 是 左 结合 的 。 所 有 的 非 终结 符 
号 都 有 一 个 综合 属性 node, 该 属性 表示 相应 的 抽象 语法 树 结 点 。 
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每 当 使 用 第 一 个 产生 式 BE, + 了 时 , 它 的 语义 规则 就 创建 出 一 个 结 点 。 创 建 时 使 用 “+ ” 作 
X op, 使 用 局 . node 和 node 作为 代表 子 表达 式 的 两 个 子 结 点 。 第 二 个 产生 式 也 有 类 似 的 规则 。 


ae s 
E.node = new Node('+', E;.node, T.node) 
E.node = new Node('—', E,.node, T.node) 
E.node = T.node 
T.node = E.node 


T.node = new Leaf (id, id.entry) 
T.node = new Leaf (num, num.val) 





图 5-10 为 简单 表达 式 构造 语法 树 


产生 式 3, MEST, 没有 创建 任何 结 点 , 因为 E. node 和 了 node 是 一 样 的 。 类 似 地 , 产生 式 
4, 即 7 一 (E), 也 没有 创建 任何 结 点 。7. node KEM E. node 的 值 相 同 ， 因 为 括号 仅仅 用 于 分 组 。 
它们 会 影响 语法 分 析 树 和 抽象 语法 树 的 结构 , 但 是 一 旦 分 组 完成 , 就 不 需要 在 抽象 语法 树 中 保留 
这 些 插 号 了 。 

最 后 两 个 7- 产 生 式 的 右 部 是 一 个 终结 符号 。 我 们 使 用 构造 函数 Leaf 来 创建 合适 的 结 点 。 这 
些 结 点 就 成 为 了 node 的 值 。 

图 5-11 显示 了 为 输入 a -4+c 构造 一 棵 抽象 语法 树 的 过 程 。 这 棵 抽象 语法 树 的 结 点 被 显示 
为 记录 。 这 些 记录 的 第 一 个 字段 是 op。 现 在, 抽象 语法 树 的 边 用 实 线 表示 。 基 础 的 语法 分 析 树 
使 用 点 虚线 表示 边 。 实 际 上 不 需要 生成 语法 分 析 树 。 第 三 种 线 是 虚线 , 它 表示 E. node 和 T. node 
的 值 。 每 条 线 都 指向 适当 的 抽象 语法 树 结 点 。 


Bnode 





to entry for c 


to entry for a 


图 5-11 ac -4+e 的 抽象 语法 树 


在 最 底 端 , 我 们 可 以 看 到 由 Leaf 构造 得 到 的 分 别 表示 a、4 和 ic 的 叶子 结 点 。 我 们 假设 词法 
值 id. entry 指向 符号 表 , 并 且 词 法 值 num. val 是 一 个 常量 值 。 根 据 规则 5 和 6, 这 些 叶子 结 点 , 或 
指向 它们 的 指针 , 变 成 了 图 中 的 三 个 标号 为 了 的 语法 分 析 树 结 点 上 的 T. node 的 值 。 请 注意 , 根 
据 规 则 3, 指向 a 对 应 的 叶子 结 点 的 指针 同时 也 是 语法 分 析 树 中 最 左边 的 EE 的 E. node 值 。 

我 们 根据 规则 2 创建 了 一 个 结 点 , 该 结 点 的 op 字段 等 于 减 号 , 它 的 指针 指向 前 两 个 叶子 结 
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上 点。 然后， 规则 工 将 对 应 于 - 的 结 点 和 第 三 个 叶子 组 合 起 来 , 得 到 这 个 抽象 语法 树 的 根 结 点 。 

如 果 这 些 规 则 是 在 对 语法 分 析 树 的 后 序 遍 历 过 程 中 求 值 eA FA SSNS 
的 , 或 者 是 在 自 底 向 上 分 析 过 程 中 和 归 约 动作 一 起 进行 求 值 po = new Maf aun i 
的 , 那么 当 图 5-12 中 显示 的 一 系列 步骤 结束 时 , ps 指向 构造 得 ol pe a, 
到 的 抽象 语法 树 的 根 结 点 。 回 ps = new Node('+', ps, pa); 

如 果 使 用 一 个 为 自 顶 向 下 语法 分 析 而 设计 的 文法 , 那么 得 
到 的 抽象 语法 树 仍然 相同 , 其 构造 的 步骤 也 相同 , 虽然 语法 分 图 5-12 -4+e 的 抽象 语法 树 
析 树 的 结构 和 抽象 语法 树 的 结构 有 极 大 的 不 同 。 的 构造 步骤 


图 5-13 中 的 工 属性 定义 完成 的 翻译 工作 和 图 5-10 中 的 S 属性 定义 所 完成 工作 的 和 
Fe ARS E, T, id 和 num 的 属性 和 例 5-11 中 讨论 的 相同 。 


Ms DS 
1) ETE E.node = E'.syn 

E’ inh = T.node 

E; inh = new Node('+', E'.inh, T.node) 

E' syn = Ej .syn 

Ei.inh = new Node('—', E' inh, T.node) 

E' syn = Ej -syn 

E'.syn = E' inh 

T.node = E.node 

T.node = new Leaf (id, id. entry) 

T.node = new Leaf (num, num.val) 













B'>+T 













E' => -T E! 

















E' +e 
5) T>(E) 
T > id 

T > num 


图 5-13 在 自 顶 向 下 语法 分 析 过 程 中 构造 抽象 语法 树 

这 个 例子 中 构造 抽象 语法 树 的 规则 和 例 5.3: 中 桌 上 计算 器 的 规则 类 似 。 在 桌 上 计算 器 的 例 
子 中 , 项 x*y 中 的 x 和 wy 位 于 语法 分 析 树 的 不 同 部 分 , 因此 在 计算 xxy 时 x 是 作为 继承 属性 传 
递 的 。 这 里 的 思想 是 在 构造 x + y 的 抽象 语法 树 时 将 x 作为 一 个 继承 属性 传递 , 因为 < 和 +y 出 现 
在 不 同 的 子 树 中 。 非 终结 符号 好 对 应 于 例 5. 3 中 的 非 终结 符号 7'。 请 比较 一 下 图 5-14 中 a -4 +e 
的 依赖 图 和 图 5-7 中 3 * 4 的 依赖 图 的 相似 之 处 。 

非 终结 符号 已 有 一 个 继承 属性 inh 和 一 个 综合 属性 syn。 属 性 E'. inh 表示 至 今 为 止 构 造 得 到 
的 部 分 抽象 语法 树 。 明 确 地 说 , 它 表示 的 是 位 于 E' 的 子 树 左 边 的 输入 串 前 级 所 对 应 的 抽象 语法 
树 的 根 。 在 图 5-14 中 依赖 图 的 结 点 5 处 , E' inh 表示 对 应 于 a 的 抽象 语法 树 的 根 , 实际 上 就 是 对 
应 于 4& 的 叶子 结 点 。 在 结 点 6 处 , E’. inh 表示 对 应 于 输入 a -4 的 部 分 抽象 语法 树 的 根 。 在 结 点 9 
处 , E'. inh 表示 a -4+c 的 抽象 语法 树 。 


ün e 
T 2 hode inh 3 B™12 syn 
w TN 
num 3 val +` T 人 node ink 9 EMI E 10 syn 


id ! entry i 











id 1 entry 


图 5-14 使 用 图 5-13 中 的 SDD 时 的 a -4 +e 的 依赖 图 
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因为 没有 更 多 的 输入 , 所 以 在 结 点 9 处 , E'. inh 指向 整个 抽象 语法 树 的 根 。 属 性 syn 把 这 个 值 沿 着 
语法 分 析 树 向 上 传递 ,直到 它 成 为 node 的 值 。 明 确 地 讲 , 结 点 10 上 的 属性 值 是 通过 产生 式 Be 所 
关联 的 规则 尼 syn = E'. inh 来 定义 的 。 在 结 点 11 处 的 属性 值 是 通过 图 5-13 中 与 产生 式 2 相关 的 规则 
E’. syn =E'1. syn 来 定义 的 。 类 似 的 规则 还 定义 了 结 点 12 和 13 处 的 值 。 m 
5.3.2 类 型 的 结构 

当 语 法 分 析 树 的 结构 和 输入 的 抽象 语法 树 的 结构 不 同时 ,继承 属性 是 很 有 用 的 。 在 这 种 情 
况 下 , 继承 属性 可 以 用 来 将 信息 从 语法 分 析 树 的 一 部 分 传递 到 另 一 部 分 。 下 一 个 例子 显示 了 这 
种 结构 上 的 不 匹配 可 能 是 由 语言 设计 引起 的 , 而 不 是 由 语法 分 析 方法 的 约束 引起 的 。 

DEE 在 C 语 言 中 ,类 型 int [2][3] 可 以 读 作 :“ 由 两 个 数组 组 成 的 数组 , 子 数组 中 有 三 个 
整数 "。 相 应 的 类 型 表达 式 amoy(2，array(3,integer) ) 可 以 使 用 图 5-15 gma 
中 的 树 来 表示 。 运 算 符 array 有 两 不 参数 , 一 个 是 数字 , 另 一 个 是 类 型 。 。 n 
如 果 使 用 树 来 表示 类 型 ， 那么 这 个 运算 符 返 回 一 个 标号 为 uray 的 结 

点 ,该 结 点 具有 两 个 子 结 点 ,分别 表 示 数 字 和 类 型 。 

使 用 图 5-16 中 的 SDD, 非 终结 符号 了 生成 的 是 一 个 基本 类 型 或 图 515 intl2][3] 
个 数组 类 型 。 非 终结 符号 B 生成 基本 类 型 int 和 float 之 一 。 当 了 推导 MAMA 
出 BC 且 C 推导 出 e 时 , 7 生成 一 个 基本 类 型 。 否则 , C 就 生成 由 一 个 整数 序列 组 成 的 数组 描述 
分 量 , 其 中 的 每 个 整数 用 方 括号 括 起 。 


integer 


t。 非 终结 符号 C 有 两 个 属性 ; 一 个 继承 属性 6 和 一 | 二 Bo | rio 

个 综合 属性 1。 继承 属性 b 将 一 个 基本 类 型 沿 着 树 | Ob= Be 

向 下 传播 , 而 综合 属性 + 则 收集 最 终 得 到 的 结果 。 | 了 | BS er 
WARN] [3] TERRES or ON 5-17 | © = [num] c, | Ot = array(num.val, Gt) 


所 示 。 图 5-15 中 的 相应 类 型 表达 式 的 构造 过 程 如 ees — A 

F: 首先 类 型 integer 从 B 开 始 , 沿 着 C 组 成 的 链 通 ai 

过 继承 属性 5 向 下 传递 。 最 后 的 数组 类 型 是 沿 着 C 图 5-16 7 生成 一 个 基本 类 型 或 一 个 数组 类 型 
组 成 的 链 、 通过 属性 i 不 断 向 上 传递 并 综合 而 得 到 的 。 


T.t = array(2, array(3, integer)) 





C.b = integer 
C.t = array(2, array(3, integer)) 


[ ee a = integer 


C.t = array(3, integer) 


es ae = integer 


[ $ ] Ct = integer 


B.t = integer 


int 





€ 


图 5-17， 数 组 类 型 的 语法 制导 的 翻译 


更 详细 地 讲 , 在 产生 式 7 一 BC 对 应 的 根 结 点 上 , 非 终结 符号 C 使 用 继承 属性 C.5 从 B 那里 
继承 类 型 。 在 最 右边 的 C 结 点 上 的 产生 式 是 Ce, 因此 C.1 等 于 C.5。 产 生 式 C 一 [num]C 的 
语义 规则 将 运算 符 array 作用 到 运算 分 量 num. val 和 C1.1 上, 43 C. t 的 值 。 国 
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5.3.3 5.3 节 的 练习 
练习 5. 3. 1: 下 面 是 涉及 运算 符 + 和 整数 或 浮 点 运算 分 量 的 表达 式 的 文法 。 区 分 浮 点 数 的 方 
法 是 看 它 有 无 小 数 点 。 


E>E+TJ|T 
T > num . num | num 


1) 给 出 一 个 SDD 来 确定 每 个 项 7 和 表达 式 五 的 类 型 。 

2) 扩展 (a) 中 得 到 的 SDD, 使 得 它 可 以 把 表达 式 转 换 成 为 后 级 表达 式 。 使 用 一 个 单 目 运算 
符 intToFloat 把 一 个 整数 转换 为 相等 的 浮 点 数 。 

| 练习 5.3.2: 给 出 一 个 SDD, 将 一 个 带 有 + 和 * 的 中 组 表达 式 翻 译 成 没有 元 余 括 号 的 表达 
式 。 比 如 ,因为 两 个 运算 符 都 是 左 结合 的 , 并 且 * 的 优先 级 高 于 +，, 所 以 ((a* (b+c))*(d)) 
可 翻译 为 cx (b+c) *d。 

| 练习 5. 3. 3: 给 出 一 个 SDD 对 x* (3 *x+%*%x) 这 样 的 表达 式 求 微分 。 表 达 式 中 涉及 运算 
符 + 和 *、 变 量 x 和 常量 。 假 设 不 进行 任何 简化 , 也 就 是 说 , 比如 3 * x 将 被 翻译 为 3 * 1 +0 * 2, 


5.4 语法 制导 的 翻译 方案 


语法 制导 的 翻译 方案 是 语法 制导 定义 的 一 种 补充 。5. 3 节 中 的 所 有 语法 制导 定义 的 应 用 都 可 
以 使 用 语法 制导 的 翻译 方案 来 实现 。 

根据 2. 3.5 节 的 介绍 可 知 , 语法 制导 的 翻译 方案 (syntax-directed translation scheme, SDT) 是 在 
其 产生 式 体 中 嵌入 了 程序 片段 的 一 个 上 下 文 无 关 文 法 。 这 些 程序 片段 称 为 语义 动作 , 它们 可 以 
出 现在 产生 式 体 中 的 任何 地 方 。 按 照 惯 例 , 我 们 在 这 些 动作 两 边 加 上 花 插 号。 如 果 花 括号 要 作 
为 文法 符号 出 现 , 则 要 给 它们 加 上 引号 。 

任何 SDT 都 可 以 通过 下 面 的 方法 实现 : 首先 建立 一 棵 语法 分 析 树 , 然后 按照 从 左 到 右 的 深度 
优先 顺序 来 执行 这 些 动作 , 也 就 是 说 在 一 个 前 序 遍 历 过 程 中 执行 。5.4.3 节 将 给 出 一 个 这 样 的 
例子 。 

通常 情况 下 ,SDT 是 在 语法 分 析 过 程 中 实现 的 , 不 会 真 的 构造 一 棵 语法 分 析 树 。 在 本 节 中 ， 
我 们 主要 关注 如 何 使 用 SDT 来 实现 两 类 重要 的 SDD: 

1) 基本 文法 可 以 用 LR 技术 分 析 , H SDD Æ S 属性 的 。 

2) 基本 文法 可 以 用 LL 技术 分 析 , H SDD 是 工 属性 的 。 

我 们 将 会 看 到 , 在 这 两 种 情况 下 , 一 个 SDD 中 的 语义 规则 是 如 何 被 转换 成 为 一 个 带 有 语义 
动作 的 SDT 的 。 这 些 动作 将 在 适当 的 时 候 执 行 。 在 语法 分 析 过 程 中 , 产生 式 体 中 的 一 个 动作 在 
它 左 边 的 所 有 文法 符号 都 被 匹配 之 后 立刻 执行 。 

可 以 在 语法 分 析 过 程 中 实现 的 SDT 可 以 按照 如 下 的 方式 识别 : 将 每 个 内 内 的 语义 动作 替换 
为 一 个 独 有 的 标记 非 终结 符号 (marker nonterminal ) 。 每 个 标记 非 终结 符号 只 有 一 个 产生 式 
W 一 ee 如 果 带 有 标记 非 终结 符号 的 文法 可 以 使 用 某 个 方法 进行 语法 分 析 , 那么 这 个 SDT 就 可 以 在 
语法 分 析 过 程 中 实现 。 

5. 4. 1 后缀 翻译 方案 

至 今 为 止 , 最 简单 的 实现 SDD 的 情况 是 文法 可 以 用 自 底 向 上 方法 来 分 析 且 该 SDD Æ S 属性 
定义 。 在 这 种 情况 下 , 我 们 可 以 构造 出 一 个 SDT, 其 中 的 每 个 动作 都 放 在 产生 式 的 最 后 , 并 且 在 
按照 这 个 产生 式 将 产生 式 体 归 约 为 产生 式 头 的 时 候 执 行 这 个 动作 。 所 有 动作 都 在 产生 式 最 右 端 
的 SDT 称 为 后 组 翻译 方案 。 

图 5-18 中 的 后 级 SDT 实现 了 图 5-1 中 的 桌 上 计算 器 的 SDD。 其 中 只 有 一 处 改动 : 第 
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一 个 产生 式 的 动作 是 打印 出 结果 值 。 其 余 的 语义 动作 和 原来 的 语义 规则 对 应 的 动作 完全 一 样 。 
因为 此 SDD 的 基本 文法 是 LR 的 , 并 上 且 这 个 SDD 是 S$ 属性 的 ; 所 以 这 些 动作 可 以 和 语法 分 析 器 的 
归 约 步骤 一 起 正确 地 执行 。 口 
5.4.2 后缀 SDT 的 语法 分 析 栈 实现 

后 缀 SDT 可 以 在 LR 语法 分 析 的 过 程 中 实现 ， 
当归 约 发 生 时 执行 相应 的 语义 动作 。 各 个 文法 符号 
的 属性 值 可 以 放 到 栈 中 的 某 个 位 置 , 使 得 执行 归 约 
的 时 候 可 以 找到 它们 。 最 好 的 方法 是 将 属性 和 文法 
符号 (或 者 表示 文法 符号 的 LR 状态 ) 一 起 放 在 栈 中 
的 记录 里 。 图 5-18 ”实现 桌 上 计算 器 的 后 级 SDT 

在 图 5-19 中 ,语法 分 析 栈 包含 的 记录 中 有 一 个 
字段 , 该 字段 用 于 存放 文法 符号 (或 语法 分 析 器 的 状态 ), 并 且 在 这 个 字段 之 下 有 一 个 字段 用 于 
存放 属性 。 三 个 文法 符号 XYZ 位 于 栈 的 顶部 , 可 能 它们 即将 按照 一 个 产生 式 , 比如 ASX Y Z, 
进行 归 约 。 这 里 , RIIA X. x 表示 的 一 个 属性 , 等 等 。 一 般 来 说 , 我 们 可 以 支持 多 个 属性 , 方 
法 是 使 记录 变 得 足够 大 , 或 者 在 栈 中 的 记录 里 放 上 指针 。 对 于 小 型 的 属性 , 将 记录 变 得 足够 大 可 
能 是 比较 简单 的 方法 ,即使 有 些 时 候 有 些 字段 不 会 被 用 到 也 没有 太 大 关系 。 然 而 , 如 果 一 个 或 多 
个 属性 的 大 小 没有 限制 ,比如 它们 是 字符 串 , 那么 最 好 把 一 个 指针 放 到 栈 记 录 的 属性 值 中 , 并 把 
实际 的 值 存 放 在 栈 之 外 的 某 个 比较 大 的 共享 存储 区 域 中 。 


位 于 产生 式 的 末端 , 那么 我 们 可 以 在 把 产生 式 体 归 综合 性 








En { print(#. val); } 
E,+T { E.val= Ei.val+T.val } 
bh { E.val = T.val: } 

{ T.val = T;.val x F.val; } 
F { T.val = F.val; } 

(五 ) { F.val = Eval; } 

digit { F.val= digit.lezval; } 


L > 
E > 
E > 
T > T xF 
T > 
F > 
FEF > 











Z. 
约 成 产生 式 头 的 时 候 计 算 各 个 属性 的 值 。 如 果 我 们 
使 用 4->XYZ 这 样 的 产生 式 进行 归 约 , 那么 此 时 区、 m 
YA Z 的 所 有 属性 值 都 是 可 用 的 , 并且 都 位 于 已 知 图 5-19 带 有 用 于 存放 综合 属性 的 
的 位 置 上 , 如 图 5-19 所 示 。 在 这 个 动作 之 后 , 4 和 字段 的 语法 分 析 栈 
它 的 属性 都 位 于 栈 的 顶端 ， 即 现在 存放 陪 的 记录 的 
位 置 上 。 


让 我 们 重 写 例 5. 14 中 桌 上 计算 器 SDT 中 的 动作 , 使 它们 显 式 地 操作 语法 分 析 栈 。 这 
样 的 栈 操作 通常 是 由 语法 分 析 器 自动 完成 的 。 

假设 语法 分 析 栈 存放 在 一 个 被 称 为 sack 的 记录 数组 中 ,而 top 是 指向 栈 顶 的 游标 。 这 样 ， 
stack| top | 指向 这 个 栈 的 栈 顶 记录 ,stack[ top - 1] 指 向 栈 顶 记 录 的 下 一 个 记录 , 依 此 类 推 。 我 们 还 
假设 每 个 记录 有 一 个 被 称 为 val 的 字段 ,该 字段 存放 了 这 个 记录 所 代表 的 文法 符号 的 属性 值 。 这 
样 ,我 们 可 以 使 用 stack[top -2].val 来 指向 出 现在 栈 中 第 三 个 位 置 上 的 属性 E. vals 完整 的 SDT 
显示 在 图 5-20 中 。 

比如 , 在 第 二 个 产生 式 BE, + 了 中 ，, 我 们 在 栈 顶 之 下 两 个 位 置 上 找到 E, 的 值 , 在 栈 顶 找到 
7 的 值 。 求 和 的 结果 放 在 归 约 之 后 产生 式 头 互 将 出 现 的 位 置 上 , 也 就 是 当前 栈 顶 之 下 两 个 位 置 
处 。 这 是 因为 在 归 约 之 后 , 最 上 面 的 三 个 符号 将 被 蔡 换 为 一 个 符号 。 在 计算 完 .val 之 后 , 我们 
将 两 个 符号 弹出 栈 , 现在 我 们 放置 E. val 的 记录 将 变 成 栈 顶 。 

在 第 三 个 产生 式 ET 中 不 需要 任何 语义 动作 ,因为 栈 的 长 度 没有 改变 , RT T val 值 直 接 变 成 
T E. val 的 值 。 产 生 式 TF Al Fdigit 的 情况 与 此 类 似 。 产 生 式 严 ,() 稍 有 不 同 。 虽 然 值 没有 改 
变 , 但 是 在 归 约 过 程 中 消除 了 栈 中 的 两 个 位 置 , 因此 这 个 值 必须 移动 到 归 约 之 后 的 位 置 上 。 
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产生 式 语义 动作 

L>En { print(stack [top — 1].val); 
top = top — 1; } 

E+E, +T { stack[top — 2].val = stack [top — 2].val + stack [top].val; 
top = top — 2; } 

五 一 了 

ToT+F { stack[top — 2].val = stack[top — 2].val x stack [top]. val; 
top = top — 2; } 

ToF 

五 一 (五 ) { stack[top.— 2].val = stack[top — 1].val; 
top = top — 2; } 

F > digit 








图 5-20 “在 一 个 自 底 向 上 语法 分 析 栈 中 实现 桌 上 计算 器 


请 注意 , 我 们 省 略 了 针对 栈 中 记录 的 第 一 个 字段 的 操作 步骤 。 这 个 字段 保存 了 LR 状态 或 文 
法 符号 。 如 果 我 们 执行 LR 语法 分 析 过 程 , 语法 分 析 表 将 给 出 每 次 归 约 之 后 的 新 状态 , 见 算法 
4. 44。 因 此 , 我 们 可 以 直接 把 这 个 新 状态 放 到 新 的 栈 顶 记录 中 。 口 
5.4.3 ”产生 式 内 部 带 有 语义 动作 的 SDT 

动作 可 以 放置 在 产生 式 体 中 的 任何 位 置 上 。 当 一 个 动作 左边 的 所 有 符号 都 被 处 理 过 后 ,该 
动作 立刻 执行 。 因 此 , 如 果 我 们 有 -一 个 产生 式 BOX a Y, 那么 当 我 们 识别 到 X( 如 果 X 是 终结 符 
号 ) 或 者 所 有 从 大 推导 出 的 终结 符号 (如 果 下 是 非 终结 符号 ) 之 后 , 动作 a 就 会 执行 。 更 准确 
地 讲 ， 

。 如 果 语 法 分 析 过 程 是 自 底 向 上 的 , 那么 我 们 在 的 此 次 出 现 位 于 语法 分 析 栈 的 栈 顶 时 ， 

我 们 立刻 执行 动作 a。 
。 如 果 语 法 分 析 过 程 是 自 顶 向 下 的 , 那么 我 们 在 试图 展开 了 的 本 次 出 现 ( 如 果 了 是 非 终结 符 
号 ) 或 者 在 输入 中 检测 区 如 果 了 是 终结 符号 ) 之 前 执行 语义 动作 a。 

可 以 在 语法 分 析 过 程 中 实现 的 SDT 包括 后 缀 SDT 和 即将 在 5.5 节 中 讨论 的 一 类 SDT, 这 类 
SDT 实现 了 工 属性 定义 。 不 是 所 有 的 SDT 都 可 以 在 语法 分 析 过 程 中 实现 , 下 面 我 们 就 给 出 一 个 
例子 。 
作为 一 个 有 问题 的 SDT 的 极端 例子 , 假设 
我 们 将 桌 上 计算 器 的 例子 改 成 一 个 可 以 打印 输入 表达 
式 的 前 级 表示 方式 的 SDT, 而 不 再 对 表达 式 进行 求 值 。 
新 SDT 的 产生 式 和 动作 显示 在 图 5-21 中 。 

遗憾 的 是 , 不 可 能 在 自 顶 向 下 或 自 底 向 上 的 语法 
分 析 过 程 中 实现 这 个 SDT, 因为 语法 分 析 程序 必须 在 
它 还 不 知道 出 现在 输入 中 的 运算 符号 是 * 还 是 + 的 时 ” 图 5-21 在 语法 分 析 过 程 中 完成 中 级 到 
候 , 就 执行 打印 这 些 符号 的 操作 。 前 级 翻译 的 有 问题 的 SDT 

在 产生 式 2 和 4 中 分 别 使 用 标记 非 终结 符号 M 和 M, 来 替代 相应 的 动作 , 一 个 移入 - 归 约 
语法 分 析 器 ( 见 4 5. 3 节 ) 在 处 理 输入 digit( 比如 3 ) 的 时 候 会 因为 不 能 确定 是 使 用 10 一 e 归 约 ， 
使 用 Myre 归 约 ,还 是 移 人 输入 数字 而 产生 一 个 冲突 。 口 

任何 SDT 都 可 以 按照 下 列 方法 实现 : 






En 
{ print('+’); } Ai +T 






{ print(’*’); } Ti+ F 
F 





bey tbe 4 


(BE) 
digit { print(digit.lexval); } 
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1) 忽略 语义 动作 , 对 输入 进行 语法 分 析 , 并 产生 一 棵 语法 分 析 树 。 

2) 然后 检查 每 个 内 部 结 点 N, 假设 它 的 产生 式 是 doo, 将 “中 的 各 个 动作 当 作 N 的 附加 子 
结 点 加 入 , 使 得 的 子 结 点 从 左 到 右 和 a 中 的 符号 及 动作 完全 一 致 。 

3) 对 这 棵 语法 树 进行 前 序 遍历 ( 见 2.3.4 节 ), 并 且 当 访问 到 一 个 以 某 个 动作 为 标号 的 结 点 
时 立刻 执行 这 个 动作 。 

比如 , 图 5-22 显示 了 带 有 插入 动作 的 表达 式 3 *5 +4 的 语法 分 析 树 。 如 果 我 们 按照 前 序 次 
序 来 访问 结 点 , 我 们 就 得 到 了 这 个 表达 式 的 前 级 形式 : + *354。 


L 

Re 
人 3 hss 7 
adh | 
ee 


{ print('«’);} T digit (prin (4); 
p digit Tang 

alle Wee Ae 
图 5-22 RAT EMIT 


5.4.4 从 SDT 中 消除 左 递归 

因为 带 有 左 递归 的 文法 不 能 按照 自 顶 向 下 的 方式 确定 地 进行 语法 分 析 , 所 以 在 4.3.3 
节 中 介绍 了 左 递归 的 消除 。 当 文法 是 SDT 的 一 部 分 时 , 我 们 还 需要 考虑 如 何 处 理 其 中 的 
动作 。 

首先 考虑 简单 的 情况 , 即 我 们 只 需要 关心 一 个 SDT 中 的 动作 的 执行 顺序 的 情况 。 比 如 , 如 果 
每 个 动作 只 打印 一 个 字符 串 , 我 们 就 只 关心 这 些 字 符 串 的 打印 顺序 。 在 这 种 情况 下 , 可 以 应 用 下 
面 的 原则 完成 这 个 转化 : 

o 当 转 换文 法 的 时 候 , 将 动作 当成 终结 符号 处 理 。 

这 个 原则 基于 下 面 的 思想 : 文法 转换 保持 了 由 文法 生成 的 符号 串 中 终结 符号 的 顺序 。 因 此 ， 
这 些 动作 在 任何 从 左 到 右 的 语法 分 析 过 程 中 都 按照 相同 的 顺序 执行 , 不 管 这 个 分 析 是 自 顶 向 下 
的 还 是 自 底 向 上 的 。 

消除 左 递归 的 “技巧 "是 对 两 个 产生 式 

A> Aa | B 

进行 替换 。 这 两 个 产生 式 生成 的 串 包 含 一 个 B 和 任意 数量 的 w。 它 们 将 被 替换 为 下 面 的 产生 式 。 


新 的 产生 式 使 用 了 一 个 新 非 终结 符号 R( 代 表 “ 其 余部 分 ” ) 来 生成 同样 的 串 。 
A— BR 
R>aRj|e 


如 果 B 不 以 A 开头 , 那么 A 就 不 再 有 左 递归 的 产生 式 。 按 照 正则 定义 的 表示 法 ,在 两 组 产生 式 中 
A 都 被 定义 为 B(a) * 。 在 4 3.3 节 中 可 以 看 到 如 何 处 理 A 有 多 个 递归 或 非 递归 产生 式 的 情况 。 
考虑 下 面 的 EE 产生 式 。 它 们 来 自 一 个 将 中 缀 表达 式 翻 译 成 后 级 表达 式 的 SDT: 


E => E+T { print('+’); } 
BEo=> 
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如 果 我 们 对 应 用 标准 的 左 递 归 消除 转换 ， 左 递归 产生 式 的 余部 为 


a = + TH{print(+’);l} 


而 B( 即 另 一 个 产生 式 的 体 ) 是 7。 如 果 我 们 引入 来 表示 的 余部 , 我 们 就 得 到 如 下 的 产生 式 集 


A. 
(= 


R 
T { print('+); } R 


aay 
tit 
HN 


El 
当 一 个 SDD 的 动作 是 计算 属性 的 值 , 而 不 是 仅仅 是 打印 输出 时 ;我 们 必须 更 加 小 心地 考虑 
如 何 消除 文法 中 的 左 递归 。 然 而 , 如 果 这 个 SDD Æ S 属性 的 , 那么 我 们 总 是 可 以 通过 将 计算 属性 
值 的 动作 放 在 新 产生 式 中 的 适当 位 置 上 来 构造 出 一 个 SDT。 
我 们 将 给 出 一 个 通用 的 解决 方案 , 以 解决 只 有 单个 递归 产生 式 、 单 个 非 递 归 产 生 式 并 且 该 左 
递归 非 终结 符号 只 有 单个 属性 的 情况 。 将 这 个 方案 推广 到 多 个 递归 / 非 递归 产生 式 的 情况 并 个 困 
难 , 但 是 写 起 来 非常 麻烦 。 假 设 这 两 个 产生 式 是 : 


A > Ay Y {A.a = g(A1-a, Y.y)} 
A 二 EX 


这 里 4 a 是 左 递归 非 终结 符号 4 的 综合 属性 , 而 X 和 Y 是 单个 文法 符号 , 分 别 有 综 合 属性 X.x 和 
Y. y。 因 为 这 个 方案 在 递归 的 产生 式 中 用 任意 的 函数 g 来 计算 4.a, 而 在 第 二 个 产生 式 中 用 任意 
函数 /来 计算 4.a 的 值 , 所 以 这 两 个 符号 可 以 代表 由 多 个 文法 符号 组 成 的 串 ， 每 个 符号 都 有 自己 
的 属性 。 在 每 种 情况 下 , SA g 可 以 把 它们 能 够 访问 的 属性 当 作 它 们 的 参数 , 只 要 这 个 SDD 是 
属性 的 。 

我 们 要 把 基础 文法 改 成 


A > XR 
Rig YR é 


图 5-23 指出 了 在 新 文法 上 的 SDT 必须 做 的 事情 。 在 图 5-23a H, 我 们 看 到 的 是 原文 法 之 上 
AGE SDT 的 运行 效果 。 我 们 将 /应 用 一 次 , 该 次 应 用 对 应 于 产生 式 AX 的 使 用 。 然 后 我 们 应 
用 函数 g, 应 用 的 次 数 和 我 们 使 用 产生 式 A AY 的 次 数 一 样 。 因 为 生成 了 Y 的 一 个 余部 , 它 的 
翻译 依赖 于 它 左 边 的 串 , 即 一 个 形 如 好 7 了 的 串 。 对 产生 式 尺 -JR 的 每 次 使 用 都 导致 对 & 的 一 
次 应 用 。 对 于 ,我 们 使 用 一 个 继承 属性 R. i 来 累计 从 4. a 的 值 开始 不 断 应 用 g 所 得 到 的 结果 。 


A.a = 9(9(f(X-2), Yi-y), Y2-y) rae 


A.a = 9(f(X.x),Vi.y) Y2 X Ri > f(X.) 
Aa = f(X.2) Yı Yı Ri = 9(f(X.2),¥i.y) 
l Ya Rai = glg(f(X-2),¥iy), You) 
a) b) € 


5-23 ”消除 一 个 后 缀 SDT 中 的 左 递归 


除 此 之 外 , R 还 有 一 个 没有 在 图 5-23 中 显示 的 综合 属性 Rs 当 尺 不 再 生成 文法 符号 工时 才 
开始 计算 这 个 属性 的 值 , 这 个 时 间 点 是 以 产生 式 Roe 的 使 用 为 标志 的 。 然 后 Rs 沿 着 树 向 上 找 
N, 最 后 它 就 可 以 变 成 对 应 于 整个 表达 式 XYY… 了 的 A. a 的 值 。 从 4 生成 XYY 的 情况 显示 在 图 
5-23 中 , 我 们 看 到 在 图 5-23a 中 的 根 结 点 上 的 4. a 的 值 使 用 了 两 次 g, 而 在 图 5-23b 的 底部 的 Ri 
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也 使 用 了 两 次 g, MEA SE AY R s 的 值 被 沿 着 树 向 上 拷贝 。 


为 了 完成 这 个 翻译 , 我 们 使 用 下 列 SDT: 
AEA UN RESA R ARER.) 
R > Y {Rai (Ri YJ} Ri {Rs= Ris} 
RB o E€ Res Rir 


请 注意 , 继承 属性 Ri 在 产生 式 体 中 的 一 次 使 用 之 前 完成 求 值 , 而 综合 属性 4.a A R. s E 
产生 式 的 结尾 完成 求 值 。 因 此 , 计算 这 些 属性 时 需要 的 任何 值 都 已 经 在 左边 计算 完成 , 变 成 了 可 
用 的 值 。 

5. 4.5 上 属性 定义 的 SDT 

在 5.4.1 节 , 我 们 将 S 属性 的 SDD 转换 成 为 后 级 SDT, 它 的 动作 位 于 产生 式 的 右 端 。 只 要 基 
础 文法 是 LR 的 , 后 级 SDT 就 可 以 按照 自 底 向 上 的 方式 进行 语法 分 析 和 翻译 。 

现在 , 我 们 考虑 更 加 一 般 化 的 情况 , 即 工 属性 的 SDD。 我 们 假设 基础 文法 将 以 自 顶 向 下 的 方 
式 进行 语法 分 析 , 因为 如 果 不 是 这 样 , 那么 翻译 过 程 常常 无 法 和 一 个 LL 或 LR 语法 分 析 器 起 完 
成 。 对 于 任何 文法 , 我 们 只 需要 将 动作 附加 到 一 棵 语法 分 析 树 中 ， 并 在 对 这 棵 树 进行 前 序 沉 历 时 
执行 这 些 动作 , 便 可 以 实现 下 面 的 技术 。 

将 一 个 工 属性 的 SDD 转换 为 一 个 SDT 的 规则 如 下 ; 

1) 把 计算 某 个 非 终结 符号 A 的 继承 属性 的 动作 插入 到 产生 式 体 中 紧 靠 在 4 的 本 次 出 现 之 前 
的 位 置 上 。 如果 4 的 多 个 继承 属性 以 无 环 的 方式 相互 依赖 ， 就 需要 对 这 些 属性 的 求 值 动作 进行 
排序 ,以 便 先 计算 需要 的 属性 。 

.2) 将 计算 一 个 产生 式 头 的 综合 属性 的 动作 放置 在 这 个 产生 式 休 的 最 右 端 。 

我 们 将 使 用 两 个 例子 来 说 明 这 些 原则 。 第 一 个 例子 是 关于 排版 的 。 它 说 明了 如 何 将 编译 技 
术 应 用 于 其 他 的 语言 处 理应 用 ,编译 技术 的 应 用 范围 并 不 限于 我 们 通常 认为 的 程序 设计 语言 
第 二 个 例子 是 关于 一 个 典型 程序 设计 语言 构造 的 中 间 代码 生成 的 , 这 个 构造 是 某 种 形式 的 while 
i 
EERE) 过 个 t 了 来自 于 数学 公式 排版 语言 。Eqn 是 这 种 语言 的 早期 例子 ,来 让 Edn 的 思想 人 
然 可 以 在 Tex 排版 系统 中 找到 , 本 书 就 是 用 Tex 排版 系统 排版 的 。 

我 们 将 关注 定义 下 标 、 下 标的 下 标 等 排版 能 力 , 而 忽略 了 上 标 、 释 加 的 分 数 以 及 其 他 数学 功 
能 。 在 Eqn 语言 中 , 人 们 可 以 使 用 a sub i sub j 来 设 定 表达 式 ai o 一 个 简单 的 boxes( 即 由 一 个 
方 框 括 起 来 的 文本 元 素 ) 的 文法 是 : 

B-+B, B, |B, subB, | (B; ) | text 

对 应 于 这 四 个 产生 式 ， 一 个 方 框 可 以 是 下 列 之 一， 

1) 两 个 并 列 的 方 框 ， 其 中 第 一 个 方 框 Bi 在 另 一 个 方 框 B; 的 左边 

2) 一 个 方 框 和 一 个 下 标 方 框 。 第 二 个 方 框 的 尺寸 较 小 且 位 置 较 低 , 位 于 第 一 个 方 框 的 右边 。 

3) 一 个 用 括号 括 起 来 的 方 框 , 用 于 方 框 和 下 标的 分 组 。Eqn 和 Tex 都 使 用 花 括号 进行 分 组 ， 
但 是 我 们 将 使 用 通常 的 圆 括号 来 分 组 ,以 避免 和 SDT 动作 两 边 的 括号 混淆 。 

4) 一 个 文本 串 ,也 就 是 任何 字符 串 。。 

这 个 文法 是 二 义 性 的 , 但 是 如 果 我 们 令 下 标 和 并 列 关系 都 是 右 结合 的 ,并且 令 sub 的 优先 级 
高 于 并 列 , 那么 我 们 仍然 可 以 使 用 它 来 完成 自 底 向 上 的 语法 分 析 ; 

表达 式 的 排版 过 程 就 是 由 较 小 的 方 框 构造 出 较 大 的 方 框 的 过 程 ;在 图 5:24 h, E, 的 方 框 和 
height 将 被 并 列 放置 形成 方 框 Ey. height. 而 E, 的 左边 方 框 本 身 又 是 从 EE 的 方 杠 和 下 标 1 的 方 
框 构造 得 到 的 。 下 标 1 的 处 理 方法 是 将 它 的 方 框 缩小 大 约 30% , 并 放 在 较 低 的 位 置 上 ,然后 把 它 
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放 在 五 的 方 框 之 后 。 虽然 我 们 将 把 . height 作为 一 个 文本 串 进 行 处 理 , 但 它 的 方 框 中 的 长 方形 会 
说 明 它 是 如 何 从 各 个 字母 对 应 的 方 框 构 造 得 到 的 。 





5-24 “从 较 小 的 方 框 构造 较 大 的 方 框 


在 这 个 例子 中 , 我 们 只 考虑 这 些 方 框 的 垂直 方向 的 几何 性 质 。 水 平方 向 的 几何 性 质 ,， 即 方 杠 
的 宽度 , 也 很 有 意思 ， 当 不 同 字符 具有 不 同 宽度 时 更 是 如 此 。 可 能 看 起 来 不 是 那么 明显 , 但 是 图 
5-24 中 的 各 个 字符 确实 具有 不 同 的 宽度 。 i 

和 这 些 方 框 的 垂直 方向 几何 性 质 相关 的 值 如 下 : 

1) 字体 大 小 (point size) 。 它 被 用 于 在 一 个 方 框 中 设置 文本 。 我 们 将 假设 不 在 下 标 中 的 字符 
被 设置 为 10 点 , 也 就 是 一 般 书 籍 的 字体 大 小 。 进 一 步 , 我 们 假设 如 果 一 个 方 框 的 字体 大 小 是 P， 
那么 它 的 下 标 方 框 的 字体 大 小 就 是 0.7p。 继 承 属性 B. ps 表示 块 B 的 字体 大 小 点 数 。 这 个 属性 必 
须 是 继承 属性 , 因为 一 个 给 定 的 块 的 上 下 文 决定 了 这 个 块 在 哪个 下 标 层次 , 从 而 决定 需要 缩小 
多 少 。 

2) 每 个 方 框 有 一 个 基线 (baseline) , 它 是 对 应 于 文本 行 的 底部 的 垂直 位 置 , 它 不 考虑 像 g 这 
样 的 伸展 到 正常 基线 之 下 的 字符 。 在 图 5-24 中 , 点 虚线 就 表示 了 方 框 妃 、. height 以 及 整个 表达 式 
的 基线 。 包 含 了 下 标 1 的 方 框 的 基线 经 过 了 调整 ,以 便 把 这 个 下 标 放 在 较 低位 置 。 

3) 每 个 方 框 有 一 个 高 度 (height), 它 是 从 方 框 顶 部 到 方 框 基 线 的 距离 。 综 合 属性 B. hi 给 出 
了 方 框 B 的 高 度 。 

4) 每 个 方 框 有 一 个 深度 (depth)， 它 是 从 基线 到 达 方 框 底部 的 旗 离 。 综 合 属性 B. dp 给 出 了 
HHE B 的 深度 。 

图 5-25 中 的 SDD 给 出 了 计算 字体 大 小 、 高 度 和 深度 的 规则 。 产 生 式 1 的 功能 是 把 初始 值 10 
WR B. ps. 


语义 规则 


Bp = 10 

















Bi.ps = B.ps 
Bo.ps = B.ps 

B.ht= max(B1 ht, Bo.ht) 

B.dp = max(Bi.dp, Bo.dp) 

3) B > Bı sub B; | Bi.ps= B.ps 

Bo.ps = 0.7 x B.ps 

B.ht = max(B,.ht, B2.ht — 0.25 x B.ps) 
B.dp = max(B,.dp, B2.dp + 0.25 x B.ps) 
4) Bo ( Bi ) B1.ps = B.ps 

B.ht = Bi.ht 

B.dp = B,.dp 

B.ht = getHt(B.ps, text.lerval) 

B.dp = getDp (B.ps, text.lexval) 








B- text 





图 5-25 方 框 排版 的 SDD 
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产生 式 2 处 理 并 列 的 情况 。 字 体 大 小 被 沿 着 语法 分 析 树 向 下 拷贝 , 也 就 是 说 ， 一 个 方 框 的 两 
个 子 方 框 从 这 个 较 大 的 方 框 中 继承 了 同样 的 字体 大 小 点 数 。 高 度 和 深度 是 沿 着 语法 分 析 树 向 上 
计算 的 , 总 是 取 两 者 的 最 大 值 。 也 就 是 说 ， 大 方 框 的 高 度 是 它 的 两 个 组 成 部 分 的 高 度 的 最 大 值 ， 
深度 也 按照 类 似 的 方法 计算 。 
产生 式 3 处 理 下 标 , 它 是 最 复杂 的 。 在 这 个 简化 了 的 例子 中 , 我 们 假设 一 个 下 标 方 框 的 字体 
大 小 是 它 的 父 方 框 的 大 小 的 70% 。 实 际 情况 会 更 加 复杂 , 因为 下 标 不 可 能 无 限 缩小 。 在 实践 中 ， 
在 几 层 下 标 之 后 , 下 标的 大 小 就 几乎 不 再 缩小 。 另 外 我 们 还 假设 一 个 下 标 方 框 的 基线 向 下 移动 
了 父 方 框 的 字体 点 数 大 小 的 25% , 同样 , 实际 情况 要 更 加 复杂 。 
产生 式 4 在 使 用 括号 的 时 候 正 确 地 拷贝 各 个 属性 。 最 后 , 产生 式 5 处 理 表 示 文 本 方 框 的 叶子 
结 点 。 在 这 里 , 实际 情况 也 是 很 复杂 的 , 因此 我 们 只 显示 了 两 个 未 定义 的 函数 geiHt 和 getDp。 它 
们 检查 各 个 字体 的 表格 ,以 确定 文本 串 中 的 全 部 字符 的 最 大 高 度 和 最 大 深度 。 我 们 假设 这 个 文 
本 串 中 的 字符 是 由 终结 符号 text 的 属性 lexval 提供 的 。 
最 后 一 个 任务 是 按照 图 5-25 中 处 理工 属性 SDD 的 规则 , 将 这 个 SDD 转换 为 SDT。 正 确 的 
SDT 显示 在 图 5-26 中 。 因 为 产生 式 的 体 比较 长 , 为 了 增加 可 读 性 , 我 们 把 它们 分 割 到 多 行 中 , 并 
把 动作 对 齐 排列 。 因 此 , 产生 式 体 包 含 了 到 下 一 个 产生 式 的 头 为 止 的 多 行内 容 。 iz 
语义 动作 
{ B.ps = 10; } 


{ Bips 王 万 .ps; } 

{ Bo.ps = B.ps; } 

{ B.ht = max(By.ht, Bo.ht); 
B.dp = max(B,.dp, Bo.dp); } 


{ Bi.ps = B.ps; } 


{ Bo.ps = 0.7 x B.ps; } 
{ B.ht= max(By.ht, Bo.ht — 0.25 x B.ps); 
了 .dp = max(B,.dp, Bo.dp + 0.25 x B.ps); } 


{Bi.ps = B.ps; } 

{ B.ht= By.ht; 
B.dp = By.dp; } 

{ B.ht = getHt(B.ps, text.lerval); 
B.dp = getDp(B.ps, text.lexval); } 





图 ,5-26， 方 框 排版 的 SDT 


我 们 的 下 一 个 例子 是 考虑 一 个 简单 的 while 语句 , 考虑 如 何 为 这 种 类 型 的 语句 生成 中 间 代 
码 。 中 间 代码 将 被 当 作 一 个 值 为 字符 串 的 属性 。 稍 后 我 们 将 探究 一 些 高 效 的 技术 。 这 些 技术 在 
我 们 进行 语法 分 析 的 时 候 顺 序 输出 一 个 取 值 为 字符 串 的 属性 的 各 个 部 分 ,从 而 避免 了 通过 长 字 
符 串 的 拷贝 来 构造 出 更 长 的 字符 串 。 这 个 技术 在 例 5. 17 中 已 经 介绍 过 。 在 那个 例子 中 , 我 们 以 
“ 边 扫 描 边 生 成 ”的 方式 生成 了 一 个 中 组 表达 式 的 后 组 形式 , 而 不 是 把 表达 式 的 后 级 形式 当 作 一 
个 属性 来 计算 。 然 而 , 在 我 们 第 一 次 表示 中 间 代码 生成 时 , 我们 通过 字符 串 的 连接 来 创建 一 个 值 
为 字符 串 的 属性 。 

DAD ExT, 我 们 只 需要 一 个 产生 式 : 
S—while(C)S, 
RE, S 是 生成 各 种 语句 的 非 终结 符号 , 我 们 假设 这 些 语句 包括 站 语句 、 赋值 语句 和 其 他 类 型 的 
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语句 。 在 这 个 例子 中 , C 表示 一 个 条 件 表 达 式 一 一 一 个 值 为 真 或 假 的 布尔 表达 式 。 

在 这 个 关于 语句 控制 流 的 例子 中 , 我 们 只 需要 生成 多 个 标号 。 我 们 假设 其 他 的 中 间 代 码 指令 都 由 
这 个 SDT 的 未 显示 部 分 生成 。 更 明确 地 讲 , 我 们 生成 显 式 的 形 如 label L 的 指令 , 其 中 工 是 一 个 标识 
符 。 这 个 指令 表明 后 一 条 指令 的 标号 是 工 。 我 们 假设 中 间 代 码 和 2. 8.4 节 中 介绍 的 代码 类 似 。 

这 个 while 语句 的 含义 是 首先 对 条 件 表达 式 C 求 值 。 如 果 它 为 真 , 控制 就 转向 8 的 代码 的 
开始 处 。 如 果 C 的 值 为 假 , 那么 控制 就 转向 跟 在 这 个 while 语句 的 代码 之 后 的 代码 。 我 们 必须 设 
HS, 的 代码 , 使 得 它 在 结束 的 时 候 能 够 跳 转 到 这 个 while 语句 的 代码 的 开始 处 。 图 5-27 没有 显 
示 出 跳 转 到 对 C 求 值 的 代码 的 开始 处 的 指令 。 

我 们 使 用 下 面 的 属性 来 生成 正确 的 中 间 代 码 : 

1) 继承 属性 S. next 是 必须 在 S 执行 结束 之 后 执行 的 代码 的 开始 处 的 标号 。 

2) 综合 属性 S. code 是 中 间 代 码 的 序列 , 它 实 现 了 语句 5, 并 在 最 后 有 一 条 跳 转 到 S. next 的 
指令 。 

3) 继承 属性 C. true 是 必须 在 C 为 真 时 执行 的 代码 的 开始 处 的 标号 。 

4) 继承 属性 C. false 是 必须 在 C 为 假 时 执行 的 代码 的 开始 处 的 标号 。 

5) 综合 属性 C. code 是 一 个 中 间 代 码 的 序列 , 它 实现 了 条 件 表 达 式 C, 并 根据 C 的 值 为 真 或 
假 跳 转 到 C. true 或 者 C. false, 

计算 while 语句 的 这 些 属性 的 SDD 显示 在 图 5-27 中 。 有 几 个 要 点 需要 解释 一 下 

S—while(C)S, Ll= new); 


L2 = new(); 
Sinent = Ll; 


C. false = S.nezt; 
C.true = L2; 
S.code = label || L1 || C.code || label || L2 || St:vode 





图 5-27 while 语句 的 SDD 


© 函数 new 生成 了 新 的 标号 。 
o AEE LI A L2 存放 了 在 代码 中 需要 的 标号 。 刀 表示 这 个 while 语句 的 代码 的 开始 处 , 我 们 
必须 安排 51 在 执行 完毕 之 后 跳 转 到 这 里 。 这 就 是 我 们 把 51. newt 设置 为 LI RA, 12 
是 Si 的 代码 的 开始 处 , CERT C. true 的 值 ， 因 为 在 C 为 真 时 会 跳 转 到 那里 。 
。 请 注意 C. false 被 设置 为 5. next, 因为 当 条 件 为 假 时 , 就 会 执行 5 的 代码 之 后 的 代码 。 
。 我 们 使 用 | 作为 连接 各 个 中 间 代 码 片 段 的 符号 。 因 此 ，S. code 的 值 的 以 标号 1 开始 ,， 然 
后 是 条 件 表达 式 C 的 代码 , 然后 是 另 一 个 标号 [2, 然后 是 51 的 代码 。 
这 个 SDD 是 工 属 性 的 。 当 我 们 把 它 转换 为 SDT 时 , 还 需要 考虑 如 何 处 理 标 号 LL M12, 它们 
是 变量 而 不 是 属性 。 如 果 我 们 把 语义 动作 当 作 哑 非 终 结 符号 来 处 理 , 那么 这 样 的 变量 可 以 当 作 
哑 非 终结 符号 的 综合 属性 来 处 理 。 因 为 Ll 和 [2 不 依赖 于 其 他 属性 ; 它们 可 以 被 分 配 到 产生 式 的 
第 一 个 语义 动作 中 。 实 现 这 个 属性 定义 的 带 有 内 嵌 语 义 动作 的 SDT 显示 在 图 5-28 中 。 口 





Swhile( { L1 = new(); L2 = new(); C.false = S.next; C.true = L2; } 
C) { Si. nert = Li; 
Sı { S.code = label || Z1 || c. code || label || Z2 || S1.code; } 








Æl 5-28 while 语句 的 SDT 
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5.4.6 5.4 节 的 练习 
练习 5. 4, 1: 我 们 在 5.4.2 节 中 提 到 可 能 根据 语法 分 析 栈 中 的 LR 状态 来 推导 出 这 个 状态 表 
示 了 什么 文法 符号 。 我 们 如 何 推导 出 这 个 信息 ? 


练习 5. 4.2: KE Fm SDT: 
A-»+ A {a} B| AB {b} | 0 
B-+B{c}A|BA{d}|1 


使 得 基础 文法 变 成 非 左 递归 的 。 这 里 , a, b,c Ald 是 语义 动作 ,0 和 1 是 终结 符号 。 
| 练习 5.4.3: 下 面 的 SDT 计算 了 一 个 由 0 和 1 组 成 的 串 的 值 。 它 把 输入 的 符号 串 当 作 按照 
正二 进 制 数 来 解释 。 


B > Bi0{B.val=2xBi.val} 
|. Bı1 {B.val = 2 x By.val + 1} 
| 1{Bval = 1} 


改写 这 个 SDT, 使 得 基础 文法 不 再 是 左 递归 的 , 但 仍然 可 以 计算 出 整个 输入 串 的 相同 的 B. val 
的 值 。 

| 练习 5. 4.4: 为 下 面 的 产生 式 写 出 一 个 和 例 5. 10 类 似 的 工 属 性 SDD。 这 里 的 每 个 产生 式 
表示 二 个 常见 的 C 语言 中 那样 的 控制 流 结构 。 你 可 能 需要 生成 一 个 三 地 址 语句 来 跳 转 到 某 个 标 
E L, 此 时 你 可 以 生成 语句 goto Lo 

1) S 一 证 (C) Sı else S 

2) 5 > do S; while ( C ) 

DS LSL + LB I< 
请 注意 , 列表 中 的 任何 语句 都 可 能 包含 一 条 从 它 的 内 部 跳 转 到 下 一 个 语句 的 跳 转 指令 , 因此 简单 
地 为 各 个 语句 按 顺 序 生成 代码 是 不 够 的 。 

练习 5. 4. 5: 按照 例 5.19 的 方法 , 把 在 练习 5.4.4 中 得 到 的 各 个 SDD 转换 成 一 个 SDT。 

练习 5.4.6: 修改 图 5-25 中 的 SDD, 使 它 包 含 一 个 综合 属性 B. le, 即 一 个 方 框 的 长 度 。 两 个 
方 框 并 列 后 得 到 的 方 框 的 长 度 是 这 两 个 方 框 的 长 度 和 。 然 后 把 你 的 新 规则 加 入 到 图 5-26 中 SDT 
的 合适 位 置 上 。 

练习 5. 4.7: 修改 图 5-25 中 的 SDD, 使 得 它 包 含 上 标 , 用 方 框 之 间 的 运算 符 sup 表示 。 如 果 
方 框 B, 是 方 框 B1 的 一 个 上 标 , 那么 将 B, 的 基线 放 在 Bi 的 基线 上 方 , 两 条 基线 的 距离 是 0.6 Fe 
LAB, 的 大 小 。 把 新 的 产生 式 和 规则 加 入 到 图 5-26 的 SDT 中 去 。 


5.5 实现 L 属性 的 SDD 


因为 很 多 翻译 应 用 可 以 用 工 属性 定义 来 解决 , 所 以 我 们 将 在 这 一 节 中 详细 地 考虑 它们 的 实 
现 。 下 面 的 方法 通过 遍历 语法 分 析 树 来 完成 翻译 工作 。 

1) 建立 语法 分 析 树 并 注释 。 这 个 方法 对 于 任何 非 循 环 定义 的 SDD 都 有 效 。 我 们 已 经 在 
5.1.2 节 中 介绍 了 注释 语法 分 析 树 。 

2) 构造 语法 分 析 树 ， 加 入 动作 ， 并 按照 前 序 顺 序 执行 这 些 动作 。 这 个 方法 可 以 处 理 任 何 工 
属性 定义 。 我 们 在 5.4.5 节 中 讨论 了 如 何 把 一 个 工 属性 SDD 转变 成 为 SDT, 还 特别 讨论 了 如 何 
根据 这 样 的 SDD 的 语义 规则 把 语义 动作 嵌入 到 产生 式 中 。 

在 这 一 节 , 我 们 讨论 下 面 的 在 语法 分 析 过 程 中 进行 翻译 的 方法 : 

3) 使 用 一 个 递归 下 降 的 语法 分 析 器 ， 它 为 每 个 非 终结 符号 都 建立 一 个 函数 。 对 应 于 非 终结 
符号 4 的 函数 以 参数 的 方式 接收 4 的 继承 属性 , 并 返回 4 的 综合 属性 。 
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4) 使 用 一 个 递归 下 降 的 语法 分 析 器 ; 以 边 扫描 边 生 成 的 方式 生成 代码 。 
5) 与 IL 语 法 分 析 器 结合 ,实现 一 个 SDT。 属 性 的 值 存放 在 语法 分 析 栈 中 , 而 各 个 规则 从 栈 
中 的 已 知 位 置 获取 需要 的 属性 值 。 
6) 与 LR 语法 分 析 器 结合 , 实现 一 个 SDT。 这 个 方法 会 让 人 觉得 惊讶 , 因为 一 个 工 属性 SDD 
的 SDT 通常 有 一 些 动 作 位 于 产生 式 的 中 间 , 而 在 一 个 LR 语法 分 析 过 程 中 , 我 们 只 有 在 构造 出 一 
个 产生 式 体 的 全 部 符号 之 后 才能 肯定 我 们 确实 可 以 使 用 这 个 产生 式 。 然 而 , 我 们 将 看 到 ,如 果 基 
RSC Ae LL 的 ,我 们 总 是 可 以 按照 自 底 向 上 的 方式 来 处 理 语法 分 析 和 翻译 过 程 。 
5.5.1 在 递归 下 降 语 法 分 析 过 程 中 进行 翻译 
4.4.1 节 讨 论 过 , 一 个 递归 下 降 的 语法 分 析 器 对 每 个 非 终结 符号 4 都 有 一 个 函数 4。 我们 可 
以 按照 如 下 方法 把 这 个 语法 分 析 器 扩展 为 一 个 翻译 器 : 
1) 函数 4 的 参数 是 非 终结 符号 4 的 继承 属性 。 
2) 函数 4 的 返回 值 是 非 终结 符号 4 的 综合 属性 的 集合 。 
在 函数 4 的 函数 体 中 ,我 们 要 进行 语法 分 析 并 处 理 属性 : 
1) 决定 用 哪 一 个 产生 式 来 展开 4。 
2) 当 需 要 读 入 一 个 终结 符号 时 , 在 输入 中 检查 这 些 符号 是 否 出 现 。 我 们 假设 分 析 过 程 不 需 
要 进行 回 湖 , 但 是 只 要 在 出 现 语法 错误 时 恢复 输入 位 置 ， 就 可 以 把 这 个 方法 扩 展 到 带 回溯 的 递归 
下 降 语法 分 析 技 术 , 见 4.4. 1 节 中 的 讨论 。 
3) 在 局 部 变量 中 保存 所 有 必要 的 属性 值 ， 这 些 值 将 用 于 计算 产生 式 体 中 非 终结 符号 的 继承 
属性 , 或 产生 式 头 部 的 非 终结 符号 的 综合 属性 。 
4) 调用 对 应 于 被 选 定 产生 式 体 中 的 非 终结 符号 的 函数 ， 向 它们 提供 正确 的 参数 。 因 为 基础 
的 SDD 是 工 属性 的 , 所 以 我 们 必然 已 经 计算 出 了 这 些 属性 并 且 把 它们 存放 到 了 局 部 变量 中 。 
BEEJ 计 我 们 考虑 例 5.19 中 while 语句 的 SDD 和 SDT。 图 5.29 显示 了 函数 8 的 相关 部 分 的 
伪 代 码 说 明 。 
我 们 显示 的 这 个 函数 S 需要 存储 并 返回 很 长 的 字符 串 ” 在 实践 中 , 更 有 效率 的 做 法 是 让 像 
Al 这 样 的 函数 返回 一 个 指针 ,指向 表示 这 些 字符 串 的 记录 。 和 那么 ， 函数 $ 中 的 返回 语句 将 不 会 
真 的 把 各 个 组 成 部 分 连接 起 来 , 而 是 构造 出 一 个 记录 或 记录 树 。 这 个 记录 或 记录 树 表 示 了 将 
Scode、Ccode、 标号 Ll Fil L2 以 及 文字 串 “ label1 ”的 两 次 出 现 全 部 连接 起 来 而 得 到 的 串 。 E] 
string S(label nezt) { 
string Scode, Code; /* 存 放 代 码 片段 的 局 部 变量 we 
label L1, L2; /* 局 部 标号 */ 
if ( 当前 输入 == 词法 单元 while ) { 


读 取 输入 ; 








Li = new(); 

L2 = new(); 

Ccode = C (nest, L2); 

检查 /)" 是 下 一 个 输入 符号 , 并 读 取 输 人 

Scode = S(L1); 

return("label" || L1 || Ccode || "label" || Z2 || Scode) 


$ 


} 
else /* 其 他 语句 类 型 */ 





图 5-29 用 一 个 递归 下 降 语 法 分 析 器 实现 while 语句 的 翻译 
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现在 我 们 将 处 理 图 5.26 中 用 于 方 框 排版 的 SDT。 我 们 首先 处 理 语法 分 析 问 题 , 因为 
图 5.26 中 的 基础 文法 是 二 义 性 的 。 下 面 经 过 转换 的 文法 使 得 并 列 运 算 和 下 标 运算 都 是 右 结合 
的 , 而 sub 的 优先 级 高 于 并 列 : 
r iT 
Fsub7, | F 
(B) | text 

引入 两 个 非 终结 符号 7 和 的 灵感 来 自 于 表达 式 中 的 项 和 因子 。 这 里 , 由 下 生成 的 一 个 因 
子 "要 么 是 一 个 括号 中 的 方 框 , 要 么 是 一 个 文本 串 。 由 了 生成 的 一 个 “项 "是 一 个 带 有 一 系列 下 标 
的 “因子 ”, TH B 生成 的 一 个 方 框 是 一 个 并 列 的 “项 ”的 序列 。 

7 和 下 的 属性 和 有 的 属性 一 样 , 因为 新 的 非 终结 符号 也 表示 方 框 。 引 入 它们 的 目的 仅仅 是 为 
了 帮助 进行 语法 分 析 。 因 此 , 和 下 都 有 一 个 继承 属性 ps 和 综合 属性 h 及 中。 它们 的 语义 动作 
可 以 从 图 5-26 的 SDT 中 修改 得 到 。 

这 个 文法 还 不 可 以 直接 进行 自 顶 向 下 的 语法 分 析 , 因为 B、7 的 产生 式 都 有 相同 的 前 级 。 比 
如 ,考虑 了。 一 个 自 项 向 下 的 语法 分 析 器 不 能 仅 在 输入 中 向 前 看 一 个 符号 就 在 7 的 两 个 产生 式 间 
做 出 决定 。 幸 运 的 是 , 我 们 可 以 使 用 4. 3.4 节 中 讨论 的 提取 左 公 因子 的 方法 , 使 得 这 个 文法 可 以 
进行 自 顶 向 下 语法 分 析 。 处 理 SDT 时 , 公共 前 级 的 概念 也 被 应 用 到 语义 动作 中 。7 的 两 个 产生 式 
都 以 非 终结 符号 下 开头 , 这 个 符号 从 了 中 继承 了 属性 ps。 

图 5.30 中 T(ps) 的 伪 代 码 中 加 大 了 F(ps) 的 代码 。 对 产生 式 TF sub Ti! 下 应 用 提取 左 公 
因子 的 操作 之 后 , 只 需要 对 下 调用 一 次 。 这 个 伪 代 码 显示 了 将 该 次 调用 蔡 换 为 下 的 代码 之 后 的 
结果 。 


AD | 
Try 


(float, float) T (float ps) { 
float h1, h2, di, d2; /* 用 于 存放 高 度 和 深度 的 局 部 变量 */ 
/* F(ps) 代码 开始 */ í 
if (当前 输入 == C) 
读 取 下 一 个 输入 ; 
(h1, d1) = B(ps); 
if (当前 输入 != 人 )' ) 语法 错误 : RAGE)! 
读 取 下 一 个 输入 ; 


} 
else if ( 当前 输入 == text ) { 
A t 等 于 词法 值 text.lexval ; 
读 取 下 一 个 输入 ; 
hl = getHt(ps, t); 
dl = getDp(ps, t); 





} 
else 语 法 错误 :期 待 text 或 者 '('; 
/* 五 (ps) 代码 结束 */ 
if (HRA == sub ) { 
读 取 下 一 个 输入 ; 
(h2, d2) = T(0.7 * ps); 
return (max(h1,h2—0.25« ps), max(d1,d2 + 0.25 * ps)); 


} 
return (h1,d1); 








图 5-30 递归 下 降 的 方 框 排 板 


B 的 函数 以 7(10.0) 的 方式 调用 函数 7, 我 们 没有 在 这 里 显示 这 个 调用 。 该 次 调用 返回 一 个 
二 元 组 , 包括 由 非 终结 符号 7 生成 的 方 框 的 高 度 和 深度 。 在 实践 中 , 它 将 返回 一 个 包含 高 度 和 深 
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度 的 记录 。 

函数 了 首先 检查 输入 是 否 为 左 括号 ;如 果 是 ， 它 就 必须 处 理 产生 式 ->(B)。 它 保存 了 括号 
中 四 返回 的 任何 值 , 但 是 如 果 了 后 面 没有 跟着 一 个 右 括号 , 那么 就 存在 语法 错误 。 处 理 这 个 语法 
错误 的 方式 没有 在 这 里 显示 。 

否则 , 如 果 当 前 的 输入 是 text, 那么 函数 了 使 用 getHzt 和 getDp 来 确定 这 个 文本 的 高 度 和 
深度 。 

然后 , 函数 了 确定 下 一 个 方 框 是 否 为 二 个 下 标 ， 如 果 是 就 调整 point size。 我 们 使 用 和 图 5-26 
的 产生 式 BB sub B 关联 的 语义 动作 来 处 理 较 大 方 框 的 高 度 和 深度 。 否 则 , 我 们 直接 返回 所 
返回 的 值 : (hl, dl)。 口 
5.5.2 边 扫 描 边 生成 代码 

如 例 5. 20 所 示 , 使 用 属性 来 表示 代码 并 构造 出 很 长 的 串 不 能 满足 我 们 的 要 求 ， 原 因 是 多 方 
面 的 ， 比 如 拷贝 和 移动 这 些 串 字符 时 需要 很 长 的 时 间 。 在 通常 情况 下 ， 比 如 在 我 们 的 代码 生成 例 
子 中 , 我 们 可 以 通过 执行 一 个 SDT 中 的 语义 动作 , 逐步 把 各 个 代码 片段 添加 到 一 个 数组 或 输出 文 
件 中 。 要 保证 这 项 技术 能 够 正确 应 用 , 下 列 要 素 必 不 可 少 : 

1) 存在 一 个 (一 个 或 多 个 非 终结 符号 的 ) 主 属性 。 为 方便 起 见 , 我 们 假设 主 属性 都 以 字符 串 
为 值 。 在 例 5. 20 中 , 属性 S. code 和 C. code 是 主 属性 , 而 其 他 属性 不 是 主 属性 。 

2) 主 属性 是 综合 属性 。 

3) 对 主 属性 求 值 的 规则 保证 : 

D 主 属性 是 将 相关 产生 式 体 中 的 非 终结 符号 的 主 属性 值 连接 起 来 得 到 的 。 连 接 时 也 可 能 包 
括 其 他 非 主 属性 的 元 素 ; 比如 字符 串 label 和 标号 L 及 12 的 值 。 

@ 各 个 非 终结 符号 的 主 属性 值 在 连接 运算 中 出 现 的 顺序 和 这 些 非 终结 符号 在 产生 式 体 中 的 
出 现 顺序 相同 。 

上 面 这 些 条 件 使 得 我 们 在 构造 主 属性 时 只 需要 在 适当 的 时 候 发 出 这 个 连接 运算 中 的 非 主 属 
性 元 素 。 我 们 可 以 依靠 对 一 个 产生 式 体 中 的 非 终结 符 号 的 对 应 函数 的 递归 调用 ,以 增 量 方式 生 
成 它们 的 主 属性 。 
DEA RT 5-29 中 的 函数 , 使 得 它 生成 主 属性 S. code 的 各 个 元 素 , 而 不 是 把 它 
们 保存 起 来 , 再 连接 得 到 S. code 的 一 个 返回 值 。 经 过 修改 的 函数 S 显示 在 图 5-31 中 。 


void S(label nezt) { 

label L1, L2; /* 局 部 标号 */ 

站 (当前 输入 == 词法 单元 while ) { 
读 取 输 入 ; 
检查 “(' 是 下 一 个 输入 符号 , 并 读 取 输 入 ; 
Li = new(); 
L2 = new(); 
print("label", L1); 
C (next, L2); 
检查 ')! 是 下 一 个 输入 符号 , 并 读 取 输 入 ; 
print("label", L2); 
SAN 


} 
else /* 其 他 语句 类 型 */ 





图 5-31 while 语句 的 on-the-fly 的 递归 下 降 代码 生成 
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在 图 5-31 中 , SAIC 现在 不 返回 任何 值 , 因为 它们 唯一 的 综合 属性 是 通过 打印 生成 的 。 而 且 

这 些 打印 语句 的 位 置 很 重要 。 打 印 输出 的 顺序 是 : 首先 是 label Ll, 然后 是 C 的 代码 ( 它 和 图 
5-29 中 的 Ceode 的 值 相同 ) , 然后 是 label 12, 最 后 是 对 5 的 递归 调用 所 生成 的 代码 ( 它 和 图 5-29 
中 的 Scode 的 值 相同 )。 这 样 , 对 5 的 一 次 调用 所 打印 的 代码 和 图 5-29 中 返回 的 Scode 的 值 相 同 。 
a] 





主 属 性 的 类 型 
我 们 的 简单 假设 要 求 主 属性 具有 字符 串 属性 ; 这 个 限制 实际 上 太 严 格 了 。 真 实 要 求 是 所 
有 主 属性 的 类 型 的 值 必须 能 够 通过 连接 各 个 元 素 而 构造 得 到 。 比 如 , 任何 类 型 的 对 象 列 表 也 
可 以 作为 主 属性 的 类 型 ， 只 要 这 些 列表 的 表示 方法 允许 我 们 把 元 素 高 效 地 加 入 到 列表 的 尾 
部 。 因 此 , 如 果 主 属性 的 目的 是 表示 一 个 中 间 代码 语句 的 序列 , 我 们 就 可 以 在 一 个 对 象 数组 
的 尾部 不 断 写 人 语句 ,最 终生 成 中 间 代码 。 当 然 , 这 个 列表 还 需要 满足 5.5.2 节 中 给 出 的 其 
他 要 求 。 比 如 , 一 个 主 属性 值 必须 由 其 他 主 属性 值 按照 非 终 结 符号 的 顺序 连接 得 到 。 | 








我 们 附带 地 对 基础 SDT 进行 相同 的 修改 : 将 一 个 主 属性 的 构造 转变 为 发 出 这 个 属性 的 元 素 
的 语义 动作 。 在 图 5-32 中 , 我 们 可 以 看 到 图 5-28 的 SDT 被 修改 成 边 扫 描 边 生 成 代码 的 SDT, 








S — while( {LL1=new);L2= new(); C.false = S.nezt; 
C.true = L2; print("label", L1); } 


C) { Si:nezt = L1; print("labe1", L2); } 
Sı 





图 5-32， 边 扫描 边 生 成 while 语句 的 代码 的 SDT 


5.5.3 上 属性 的 SDD 和 LL 语法 分 析 
假设 一 个 工 属性 SDD 的 基础 文法 是 一 个 LL 文法 , 并且 我 们 已 经 按照 5.4. 5 节 中 描述 的 方法 
把 它 转换 成 一 个 SDT, 其 语义 动作 被 符 入 到 各 个 产生 式 中 。 然 后 , 我 们 就 可 以 在 LL 语法 分 析 过 
程 中 完成 翻译 过 程 , 其 中 的 语法 分 析 栈 需要 进行 扩展 ， 以 存放 语义 动作 和 属 性 求 值 所 需 的 某 些 数 
据 项 。 一 般 来 说 , 这 些 数据 项 是 属性 值 的 拷贝 。 
除了 那些 代表 终结 符号 和 非 终结 符号 的 记录 之 外 ,语法 分 析 栈 中 还 将 保存 动作 记录 (action- 
record) 和 综合 记录 (synthesize-record) , 其 中 动作 记录 表示 即将 被 执行 的 语义 动作 , 而 综合 记录 保 
存 非 终 结 符号 的 综合 属性 值 。 我 们 使 用 下 列 两 个 原则 来 管理 栈 中 的 属性 : 
© 非 终结 符号 A 的 继承 属性 放 在 表示 这 个 非 终 结 符号 的 栈 记 录 中 。 对 这 些 属性 求 值 的 代码 
通常 使 用 紧 靠 在 4 的 栈 记录 之 上 的 动作 记录 来 表示 。 实 际 上 , 从 工 属性 的 SDD 到 SDT 的 
转换 方法 保证 了 动作 记录 将 紧 靠 在 4 的 上 面 。 
o 非 终结 符号 4 的 综合 属性 放 在 一 个 单独 的 综合 记录 中 , 它 在 栈 中 紧 靠 在 4 的 记录 之 下 。 
这 个 策略 在 语法 分 析 栈 中 放置 了 多 种 类 型 的 记录 , 这 些 不同 的 记录 类 型 将 被 当 作 “ 栈 记录 ” 
的 子 类 进行 正确 管理 。 在 实践 中 , 我 们 可 能 把 几 个 记录 组 合成 一 个 记录 , 但 是 如 果 要 解释 这 个 方 
法 的 基本 思想 ,最 好 还 是 把 用 于 不 同 目的 的 数据 分 别 存放 在 不 同 的 记录 中 。 
动作 记录 包含 指向 将 被 执行 的 动作 代码 的 指针 。 动 作 也 可 能 出 现在 综合 记录 中 , 这些 动作 
通常 把 其 他 记录 中 的 综合 属性 拷贝 到 栈 中 更 低 的 位 置 上 。 在 这 个 综合 属性 所 在 的 记录 被 弹出 栈 
之 后 , 语法 分 析 程 序 需要 在 这 个 较 低 的 位 置 上 找到 该 属性 的 值 。 
我 们 简单 地 看 一 下 LL 语法 分 析 技 术 , 以 了 解 为 什么 需要 建立 属性 的 临时 拷贝 。 根 据 4.4.4 
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节 的 介绍 可 知 ; 二 个 通过 分 析 表 驱动 的 LL 语法 分 析 器 模拟 了 一 个 最 左 推导 过 程 。 如 果 w 是 至 今 
为 止 已 经 匹配 完成 的 输入 , 那么 栈 中 就 包含 了 一 个 文法 符号 序列 a, 使得 5 Sua, 其 中 S 是 开始 
符号 。 当 语法 分 析 器 按照 一 个 产生 式 AB C 展开 的 时 候 , 它 把 栈 顶 的 4 替换 为 BC。 

假设 非 终结 符号 C 有 一 个 继承 属性 C. i。 对 于 产生 式 4 一 BC, 继承 属性 C. i 可 能 不 仅仅 依赖 
FA 的 继承 属性 , 还 可 能 依赖 于 B 的 所 有 属性 。 因 此 , 我 们 可 能 需要 在 计算 C. i 之 前 完成 对 B 的 
处 理 。 因 此 ; 我 们 需要 计算 C i 所 需 的 所 有 属性 值 的 临时 拷贝 存放 到 计算 C. i 的 动作 记录 中 。 否 
则 ， 当 语法 分 析 器 把 栈 顶 的 4 替换 为 BC 的 时 候 , 4 的 继承 属性 就 和 它 的 栈 记录 一 起 消失 了 。 

因为 基础 SDD 是 工 属性 的 , 我 们 可 以 肯定 当 4 位 于 栈 顶 时 , 4 的 继承 属性 的 值 是 可 用 的 。 因 
此 当 需 要 把 这 些 值 找 贝 到 对 C 的 继承 属性 求 值 的 动作 记录 中 时 , 这些 值 也 是 可 用 的 。 不 仅 如 此 ， 
用 于 存放 4 的 综合 属性 的 空间 也 不 成 问题 , 因为 这 个 空间 位 于 4 的 综合 记录 中 ,而 这 个 记录 在 语 
法 分 析 器 使 用 4_*B C 进行 展开 时 还 保持 在 分 析 栈 中 (位 于 了 和 C 之 下 )。 

当 处 理 卫 时 ,如 果 需 要 , 我 们 可 以 (通过 栈 中 紧 靠 在 中 之 上 的 一 个 记录 ) 执行 一 个 动作 , HE 
的 继承 属性 拷贝 给 C 使 用 。 在 处 理 完 B 之 后 , 如 果 需 要 ，B 的 综合 记录 也 可 以 拷贝 它 的 综合 属性 
供 C 使 用 。 类 似 地 , 也 可 能 需要 一 些 临时 变量 来 计算 A 的 综合 属性 的 值 。 这 些 值 可 以 在 先后 处 
理 B 和 C 的 时 候 被 拷贝 到 4 的 综合 记录 中 。 所 有 这 些 属性 的 拷贝 工作 能 够 正确 进行 的 原理 是 : 

o 所 有 拷贝 都 发 生 在 对 某 个 非 终结 符号 的 一 次 展开 时 创建 的 不 同 记录 之 间 。 因 此 , 这 些 记 

录 中 的 每 一 个 都 知道 其 他 各 个 记录 在 栈 中 离 它 有 多 远 ， 因 此 可 以 安全 地 把 值 写 到 它 下 面 
的 记录 中 。 

下 一 个 例子 说 明了 通过 不 断 地 拷贝 属性 值 , 在 LL 语法 分 析 过 程 中 实现 继承 属性 的 方法 。 有 
可 能 存在 一 些 捷径 或 者 优化 方法 , 对 于 那些 只 把 一 个 属性 值 拷贝 到 另 一 个 属性 值 的 拷贝 规则 而 
言 更 是 如 此 。 我 们 要 到 例 5. 24 中 再 说 明 这 个 问题 , 该 例子 还 演示 了 对 综合 记录 的 处 理 方法 。 
DEJ 这 个 例子 实现 了 图 5-32 中 的 SDT, 该 SDT 边 扫描 边 为 while 语句 生成 代码 。 这 个 SDT 
中 除了 表示 标号 的 哑 属 性 之 外 , 没有 综合 属性 。 

图 5-33a 显示 了 我 们 即将 使 用 while 产生 式 来 展开 S 的 情况 。 这 里 假设 我 们 已 经 知道 输入 的 
向 前 看 符号 就 是 while。 栈 顶 的 记录 对 应 于 S, 它 只 包含 继承 属性 5. next。 我 们 假设 这 个 属性 的 值 
为 x。 因 为 我 们 现在 以 自 顶 向 下 方式 进行 语法 分 析 , 所 以 按照 惯例 把 栈 顶 显示 在 左边 。 
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L1 = new(); 
L2 = new(); 
stack|top — 1].false = snect; 
stack|top — 1].true = L2; 

stack{top — 3].all = L1; 
stack|top — 3].al2 = L2; 
print("labe1", L1); 


stack|top 一 T]-nezt = all; 
print("label", al2); 








b) 
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图 5-33 根据 while 语句 的 产生 式 扩展 $ 


ee we 

图 5.33b 显示 了 我 们 展开 S 之 后 的 情况 。 在 非 终结 符号 CMS, 之 前 存在 动作 记录 ,它们 对 
应 于 图 5.32 中 的 基础 SDT 的 语义 动作 。C 的 记录 包含 了 存放 继承 属性 true A false 的 字段 ,而 S 
的 记录 包含 了 存放 属性 next 的 字段 。 所 有 的 5 记录 都 必须 包含 这 个 字段 。 我 们 将 这 些 字段 的 值 
显示 为 ?, 因为 我 们 现在 还 不 知道 它们 的 值 。 

接 下 来 , 语法 分 析 器 识别 了 输入 中 的 while 和 (， 并 将 它们 的 记录 弹出 栈 。 现 在 , 第 一 个 动作 
位 于 栈 顶 , 因此 必须 执行 这 个 动作 。 这 个 动作 记录 有 一 个 字段 snet, 该 字段 存放 了 继承 属性 
S. next 的 一 个 拷贝 。 当 S 被 弹出 栈 的 时 候 ，S. next 的 值 被 拷贝 到 字段 snext Ho FER C 的 继承 属 
性 值 的 时 候 将 用 到 这 个 字段 。 第 一 个 动作 的 代码 生成 了 Ll 和 [2 的 新 值 , 我 们 分 别 将 这 两 个 值 候 
设 为 y 和 z。 下 一 步 是 令 C. true 的 值 等 于 z。 我们 把 这 个 赋值 语句 写作 stack[ top -1]. true = 12 是 
因为 只 有 当 这 个 动作 记录 位 于 栈 顶 时 这 个 语句 才 会 被 执行 , 因此 top -1 指向 它 下 面 的 记录 , 即 C 
的 记录 。 

第 一 个 动作 记录 将 L1 拷贝 到 第 二 个 动作 记录 的 all 字段 中 , 在 该 处 它 将 用 于 Si next HR 
值 。 它 也 会 将 以 拷贝 到 第 二 个 动作 记录 中 的 al2 字段 中 , 第 二 个 动作 需要 这 个 值 来 正确 打印 输 
出 。 最 后 , 第 一 个 动作 记录 将 label y 打印 到 输出 设备 。 

完成 了 第 一 个 动作 并 将 它 的 记录 弹出 栈 之 后 的 情形 显 
示 在 图 5-34 中 。 在 C 的 记录 中 的 继承 属性 值 都 已 经 正确 
填写 好 , 同时 第 二 个 动作 记录 中 的 临时 变量 all 和 al2 也 
已 经 填写 好 。 此 时 C 被 展开 , 我 们 假设 实现 条 件 表达 式 C ; 

的 包含 了 正确 跳 转 到 x 和 z 的 指令 的 代码 已 经 生成 。 当 C 
的 记录 被 弹出 栈 时 ，) 的 记录 变 成 了 栈 顶 , 使 得 语法 分 析 器 
检查 输入 中 的 )。 图 5-34 C 之 上 的 动作 被 执行 之 后 

当 5 之 上 的 动作 位 于 栈 顶 时 , 它 的 代码 设置 51. newt, 并 打印 出 label z。 上 述 工作 完成 之 
E, Si 的 记录 成 为 栈 顶 。 随 着 S 被 展开 , 假设 它 正确 地 生成 了 5, 的 代码 。 不 管 51 是 什么 类 型 
的 语句 , 生成 的 代码 正确 地 实现 了 这 个 语句 , 随后 跳 转 到 yo 口 
现在 让 我 们 考虑 同样 的 while 语句 , 但 是 翻译 方法 把 输出 5. code 作为 一 个 综合 属性 ， 
市 不 是 通过 边 扫 描 边 处 理 的 方式 生成 。 记 住 下 面 的 不 变 式 , 或 者 说 归纳 假设 , 有 助 于 理解 接 下 来 
的 解释 。 我 们 假设 这 些 假设 适用 于 每 个 非 终 结 符号 : 

。 每 个 具有 代码 的 非 终结 符号 都 把 它 的 (字符 串 形式 的 ) 代码 存放 在 栈 中 该 符号 的 记录 下 方 
的 综合 记录 中 。 
假设 这 个 结论 为 真 , 我 们 处 理 while 产生 式 时 , 将 使 它 在 处 理 完成 后 仍然 成 立 , 成 为 一 个 不 
变 式 。 

图 5.35a 显示 了 使 用 while 语句 的 产生 式 展开 8 之 前 的 情形 。 我 们 在 栈 顶 看 到 的 是 5 的 记录 。 
和 例 5.23 中 一 样 , 它 有 一 个 存放 继承 属性 S. next 的 字段 。 紧 靠 在 这 个 记录 之 下 是 S 的 本 次 出 现 
的 综合 记录 , 它 有 一 个 存放 S. code 的 字段 。 每 个 8 的 综合 记录 都 包含 这 个 字段 。 我 们 还 显示 了 
其 他 一 些 用 于 局 部 存储 和 动作 的 字段 , 因为 图 5-28 中 while 产生 式 的 SDT 实际 上 是 一 个 更 大 的 
SDT 的 一 部 分 。 

我 们 对 5 的 展开 是 基于 图 5-28 中 的 SDT 的 , 展开 的 情形 显示 在 图 5-35b 中 。 作 为 一 种 捷径 ， 
我 们 假设 在 展开 过 程 中 继承 属性 5. next 被 直接 赋 给 C. false, 而 不 是 先 放 到 第 一 个 动作 中 , 然后 再 
拷贝 到 C 的 记录 中 。 










stack|top 一 T]-next = al; 
print("label", al2); 
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top 
s Synthesize 
S.code a) 


actions 


top 
; Synthesize 
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S.code 





Synthesize 
S.code 
| data | 


actions 






stack|top — 3].Ccode = code; 


stack{top — 1].code = 
"label" || 11 || Ceode 
|| "label" || 12 || code; 












stack{top — 1].true = L2; 
stack{top — 4].nezt = L1; 
stack[top — 5].l1 = L1; 
stack[top — 5].12 = L2; 











Æ 5-35 ” 栈 中 构造 的 具有 综合 属性 的 5 的 扩展 


我 们 看 一 下 各 个 记录 在 变 成 栈 顶 的 时 候 会 做 哪些 事情 。 首 先 , while 记录 使 得 词法 单元 while 
和 输入 匹配 。 这 是 一 定 会 匹配 的 , 否则 我 们 就 不 会 用 这 个 产生 式 来 展开 S$。 在 while 和 (被 弹出 栈 
之 后 , 执行 动作 记录 中 的 代码 。 它 生成 了 Ll 和 [2 的 值 , 我 们 通过 捷径 直接 把 它们 拷贝 到 需要 它 
们 的 继承 属性 中 ， 即 S1. next 和 C. true 中 。 这 个 动作 的 最 后 两 个 步骤 把 Ll 和 12 拷贝 到 被 称 为 
“Synthesize S,. code” 的 记录 中 。 

S, 的 综合 记录 有 两 个 任务 : 它 不 仅仅 要 保存 综合 属性 51: code, 它 还 要 作为 一 个 动作 记录 对 
整个 产生 式 Swhile (C) Si 的 属性 求 值 。 特 别 是 ， 当 它 到 达 栈 顶 时 , 它 将 计算 综合 属性 S. code, 
并 将 这 个 值 放 到 产生 式 头 5 的 综合 记录 中 。 

当 C 成 为 栈 顶 的 时 候 , 它 的 两 个 继承 属性 都 已 经 计算 完成 。 根 据 上 面 给 出 的 归纳 假设 ， 
我 们 假设 它 正确 地 生成 了 代码 , 该 代码 执行 了 它 的 条 件 判 断 并 跳 转 到 正确 的 标号 。 我 们 同 
时 假设 在 展开 C 时 执行 的 动作 正确 地 把 这 个 代码 放 在 了 栈 中 下 面 的 记录 中 ,作为 综合 属性 
C. code 的 值 。 

在 C 被 弹出 栈 后 ，C. code 的 综合 记录 成 为 栈 顶 。 它 的 代码 要 在 Si. code 的 综合 记录 中 使 用 ， 
因为 我 们 要 在 那里 把 所 有 的 代码 元 素 连 接 起 来 得 到 S. codes KHE, C. code 的 综合 记录 中 有 一 个 语 
义 动作 把 C. code 拷贝 到 S,. code 的 综合 记录 中 。 完 成 上 述 工 作 之 后 , 词法 单元 ) 的 记录 到 达 栈 顶 ， 
使 得 语法 分 析 器 检查 输入 中 的 )。 假 设 这 个 测试 成 功 , S 的 记录 变 成 栈 顶 。 根 据 我 们 的 归纳 假 
设 , 这 个 非 终结 符号 被 展开 。 这 次 展开 的 最 终 效 果 是 它 的 代码 被 正确 构造 出 来 , 并 被 放 到 51 的 
综合 记录 中 存放 code 的 字段 中 。 i 

ME, S 的 综合 记录 的 所 有 数据 字段 都 已 经 填充 完毕 ,因此 当 它 变 成 栈 顶 时 , 该 记录 
中 的 动作 就 可 以 被 执行 。 这 个 动作 使 得 标号 和 来 自 C. code Fil $i. code 的 代码 按照 正确 的 顺 
序 被 连接 到 一 起 。 得 到 的 串 放 在 栈 中 下 面 的 记录 中 , 也 就 是 $ 的 综合 记录 中 。 我 们 现在 已 
经 正确 地 计算 出 了 S. code, 并 且 当 5 的 综合 记录 变 成 栈 顶 时 , 该 代码 可 以 被 放置 到 栈 中 更 低 
层 的 另 一 个 记录 中 ，, 在 那里 它 最 终 会 被 组 装 到 一 个 更 大 的 代码 串 中 , 用 于 实现 了 包含 这 个 5S 
的 更 大 的 程序 元 素 。 四 
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我 们 可 以 处 理 LR 文法 上 的 L 属性 SDD 吗 ? 

在 5.4.1 节 中 ,我 们 看 到 在 LR 文法 上 的 每 个 S 属性 SDD 都 可 以 在 自 底 向 上 语法 分 析 过 程 
中 实现 。 根据 5.3.5 W, LL 文法 上 的 每 个 工 属性 都 可 以 在 自 顶 向 下 语法 分 析 中 实现 。 因为 LL 
文法 类 是 LR 文法 类 的 一 个 真子 集 ,并 且 S 属性 SDD 类 是 工 属 性 SDD 类 的 一 个 真子 集 ,那么 我 
们 能 否 以 自 底 向 上 的 方式 处 理 每 个 LR 文法 和 每 个 工 属性 SDD W? 

如 下 面 的 直观 论述 指出 的 ;我 们 不 能 这 么 做 。 假设 我 们 有 一 个 ER 文法 的 产生 式 4 一 BC， 
并 且 有 一 个 继承 属性 B. i, 它 依赖 于 4 的 继承 属性 。 当 我 们 规约 到 B 的 时 候 , 我 们 还 没有 看 到 
由 C 生成 的 输入 ;因此 不 能 确定 会 扫描 到 产生 式 4 一 BC 的 体 。 因 此 ,我 们 在 此 时 还 不 能 计算 
8B.i, 因 为 我 们 不 能 确定 是 否 使 用 和 这 个 产生 式 相 关联 的 规则 。 

也 许 我 们 可 以 等 到 已 经 归 约 得 到 C, 并 且 知 道 必须 把 BC 归 约 到 4 时 才 进 行 计算 。 然 而 ， 
即使 到 那个 时 候 , 我 们 仍然 不 知道 4 的 继承 属性 ,因为 即使 在 归 约 之 后 ,我 们 仍然 不 能 确定 包 
含 这 个 4 的 是 哪个 产生 式 的 体 。 我 们 可 以 说 这 个 决定 也 应 该 推迟 ,因此 也 需要 将 B. i 的 计算 
进一步 推迟 。 如 果 我 们 继续 这 样 推迟 ,我 们 很 快 会 发 现 必须 把 所 有 的 决定 推迟 到 对 整个 输入 
的 语法 分 析 完 成 之 后 再 进行 。 实 质 上 ,这 就 是 “ 先 构造 语法 分 析 树 ,再 执行 翻译 ”的 策略 。 











5.5.4 上 属性 的 SDD 的 自 底 向 上 语法 分 析 

我 们 可 以 使 用 自 底 向 上 的 方法 来 完成 任何 可 以 用 自 顶 向 下 方式 完成 的 翻译 过 程 。 更 准确 地 
说 ; 给 定 一 个 以 I 文 法 为 基础 的 互 属性 SDD, 我 们 可 以 修改 这 个 文法 , 并 在 LR 语法 分 析 过 程 中 
计算 这 个 新 文法 之 上 的 SDD。 这 个 “技巧 "包括 三 个 部 分 : 

1) 以 按照 5.4.5 节 中 的 方法 构造 得 到 的 SDT 为 起 点 。 这样 的 SDT 在 各 个 非 终结 符号 之 前 放 
置 语义 动作 来 计算 它 的 继承 属性 ; 并 且 在 产生 式 后 端 放 置 一 个 动作 来 计算 综合 属性 。 

2) 对 每 个 内 嵌 的 语义 动作 ,向 这 个 文法 中 引信 一 个 标记 非 终结 符号 来 替换 它 。 每 个 这 样 的 
位 置 都 有 一 个 不 同 的 标记 ,并 且 对 于 任意 一 个 标记 M 都 有 一 个 产生 式 Me, 

3) 如 果 标 记 非 终结 符号 M ERNER Aala B 中 替换 了 语义 动作 4a, 对 a 进行 修改 得 
Bll a’, JHA a’ 关联 到 Moe 上 。 这 个 动作 @? 

D 将 动作 a 需要 的 4 或 a 中 符号 的 任何 属性 作为 必 的 继承 属性 进行 拷贝 。 

O 按照 a 中 的 方法 计算 各 个 属性 , 但 是 将 计算 得 到 的 这 些 属性 作为 M 的 综合 属性 。 

这 个 变换 看 起 来 是 非法 的 , 因为 通常 和 产生 式 Moe 相关 的 动作 将 不 得 不 访问 某 些 没有 出 现 
在 这 个 产生 式 中 的 文法 符号 的 属性 。 然 而 , 我 们 将 在 LR 语法 分 析 栈 上 实现 各 个 语义 动作 。 因 此 
必要 的 属性 总 是 可 用 的 , 它们 位 于 栈 顶 之 下 的 已 知 位 置 上 。 
OBEJ 假设 个 文法 中 存在 一 个 产生 式 4>B C, 而 继承 属性 B. i 是 根据 继承 属性 4. i 按 
照 某 个 公式 B. i =f(4.i) 计 算得 到 的 。 也 就 是 说 , 我 们 关心 的 SDT 片段 是 

A> {B.i= f(Ai);} BC 

我 们 引信 标记 M, M 有 继承 属性 M. i 和 综合 属性 M. so MAE A. i 的 一 个 拷贝 ,而 后 者 将 成 

为 B.i。 这 个 SDT 将 被 写作 


A>MBC 
M > {Mi = Ai; M.s = f(M.i);} 


请 注意 ,，M 的 规则 中 不 可 以 使 用 4.i, 但 是 实际 上 我 们 将 设法 安排 分 析 栈 ， 使 得 如 果 即 将 进 
行 一 个 到 4 的 归 约 , 那么 4 的 每 个 继承 属性 都 将 出 现在 栈 中 执行 这 个 归 约 的 位 置 下 方 , 从 该 处 就 
可 以 读 到 这 些 继承 属性 。 因 此 ， 当 我 们 将 e 归 约 为 办 时 ,我们 直接 在 它 的 下 方 找到 A i, 在 那里 
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读 取 到 它 的 值 。 另 外 , M. s 的 值 和 一 起 存放 在 栈 中 , CUKRE B. i, 以 后 在 进行 到 8 的 归 约 
时 可 以 在 下 方 找到 这 个 值 。 口 





| 为 什么 标记 能 够 正确 工作 ? 

标记 是 只 能 推导 出 的 非 终结 符号 ,每 个 标记 在 所 有 产生 式 体 中 只 出 现 一 次 。 我 们 将 正 
式 证 明 如 果 一 个 文法 是 EL 的 ,那么 标记 非 终结 符号 可 以 被 插入 到 产生 式 体 中 的 任何 位 置 ， 并 
目 结 果 文 法 是 LR 的 。 如 果 文 法 是 LL 的 ,那么 我 们 只 需要 看 输入 符号 串 的 第 一 个 符号 (如 
果 w 为 空 则 是 下 一 个 符号 ) ,就 可 以 确定 w 是 否 可 以 从 4 开始 ,经 过 一 个 以 产生 式 4->a 开头 
的 推导 序列 得 到 。 因 此 ,如 果 我 们 用 自 底 向 上 的 方式 对 必 进行 语法 分 析 , 那 么 只 要 w 的 开头 出 
现在 输入 中 ,我 们 就 可 以 确定 w 的 一 不 前 级 首先 必须 被 归 约 成 为 ,然后 再 归 约 到 5。 特 别 是 ， 
加 果 我 们 在 a 的 任何 位 置 插入 标记 ,相应 的 LR 状态 将 隐 含 地 表明 这 个 标记 必定 存在 ,并 将 在 
输入 的 正确 位 置 上 把 e 归 约 为 标记 。 











PEERS 本 例 中 我 们 把 图 5-28 的 SDT 修改 成 基于 经 过 修改 的 LR 文法 的 SDT, 新 的 SDT 可 以 
和 LR 语法 分 析 器 一 起 完成 翻译 。 我 们 在 C 之 前 引入 标记 M, ES 之 前 引入 标记 N, 因此 基础 文 
法 变 成 

S 一 while(MC)NS; 

Mi ae 

N > e 

在 我 们 讨论 标记 M 及 N 的 关联 动作 之 前 , 先 给 出 有 关 属 性 存放 位 置 的 “归纳 假设 ”。 

1) 在 while 产生 式 的 整个 产生 式 体 之 下 (就 是 说 在 栈 中 的 while 之 下 ) 将 是 继承 属性 S. next 
我 们 可 能 不 知道 这 个 栈 记录 与 哪个 非 终结 符号 或 语法 分 析 器 状态 相关 ,但 是 我 们 肯定 该 记录 有 
一 个 字段 存放 了 S. next。 这 个 字段 位 于 该 记录 中 的 固定 位 置 上 , 并 且 在 我 们 知道 S 推导 出 什么 短 
语 之 前 就 已 经 计算 得 到 了 S. next. 

2) 继承 属性 C: true 和 C.Jfalse 将 紧 靠 在 C 的 栈 记 录 的 下 方 。 因 为 假设 这 个 文法 是 IIL 的, 输 
入 中 出 现 的 while 告诉 我 们 while 产生 式 是 唯一 可 能 被 识别 的 产生 式 ,因此 我 们 可 以 肯定 M 将 出 
现在 栈 中 紧 靠 C 的 下 方 , 而 MM 的 记录 将 保存 C 的 这 些 继承 属性 。 

3) 类 似 地 , 继承 属性 51. next 必定 出 现在 栈 中 紧 靠 51 的 下 方 ,因此 我 们 把 该 属性 放 在 N 的 
记录 中 。 

4) 综合 属性 C. code 将 出 现在 C 的 记录 中 。 我 们 期 望 在 实践 中 这 个 记录 中 出 现 的 是 一 个 指向 
这 个 字符 串 (对 象 ) 的 指针 ， 而 该 字符 串 本 身 位 于 栈 外 。 当 有 一 个 属性 的 值 是 很 长 的 字符 串 时 ， 
我 们 总 是 这 样 处 理 。 

5) 类 似 地 , 综合 属性 51. code 将 出 现在 Si 的 记录 中 。 

现在 我 们 跟踪 一 个 while 语句 的 语法 分 析 过 程 。 假 设 一 个 保存 5. newt 的 记录 出 现在 栈 顶 , 并 
且 下 一 个 输入 是 终结 符号 while。 我 们 把 这 个 终结 符号 移 人 栈 中 。 此 时 识别 出 的 产生 式 肯定 是 
while 产生 式 , 因此 LR 语法 分 析 器 可 以 移入 “( ”并 确定 下 一 步 把 e 归 约 为 M。 此 时 的 栈 显示 在 图 
5-36 中 。 我 们 同时 还 在 该 图 中 显示 了 和 MM 的 归 约 相关 联 的 动作 。 我 们 创建 出 L1 和 [2 的 值 , 它 
们 被 存放 在 M 的 记录 的 域 中 。 同 处 这 个 记录 还 有 C. true 和 C. false 的 域 。 这 些 属性 必定 在 这 个 记 
录 的 第 二 和 第 三 个 域 中 。 这 是 为 了 和 可 能 在 不 同上 下 文中 出 现 于 C 之 下 , 且 需 要 为 C 提供 这 些 
属性 的 其 他 栈 记录 保持 一 致 。 这 个 动作 最 后 把 两 个 值 赋 给 C. true 和 C. false。 其 中 的 第 一 个 值 来 
自 于 刚刚 生成 的 2, 另 一 个 则 从 栈 下 方 存放 S. next 的 地 方 获取 。 
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在 将 e 归 约 到 M 的 过 程 
中 执行 的 代码 


L1 = new(); 
L2 = newl); 
C.true = L2; 
C.false = stack|top — 3].nezt; 





图 5-36 在 将 e 归 约 为 MM 之 后 的 LR 语法 分 析 栈 


我 们 假设 后 面 的 输入 被 正确 地 归 约 为 C。 因 此 , 综合 属性 C. code 存放 在 C 的 记录 中 。 这 一 
次 对 栈 的 改变 显示 在 图 5-37 中 。 该 图 还 显示 了 接 下 来 将 被 放 到 栈 中 的 多 个 记录 , 它们 将 被 放 到 


0 的 记录 之 .上 
top 
EN 





e e] 


S.nert 





图 5-37 即将 把 while 产生 式 的 体 归 约 为 $ 之 前 的 栈 


继续 识别 while 语句 , 语法 分 析 器 下 一 步 将 在 输入 中 发 现 “)”, 把 它 放 在 该 符号 自己 的 记录 中 , 并 
压 人 栈 中 。 因 为 文法 是 LLH, 因此 语法 分 析 器 在 该 点 上 已 经 知道 它 在 处 理 一 个 while 语句 。 语 
法 分 析 融 将 把 e 归 约 为 N。 和 VV 相关 联 的 唯一 数据 是 继承 属性 51. nerto WER, 需要 将 这 个 属 
性 存放 在 此 记录 中 的 原因 是 这 个 记录 将 恰好 位 于 51 的 记录 之 下 。 计 算 Sy. next 的 值 的 代码 是 
Sı.nezt = stack[top — 3].L1; 

这 个 动作 从 NW 之 下 三 个 记录 的 地 方 获取 了 A 的 值 。 当 这 个 代码 执行 的 时 候 , N 的 记录 位 于 
RD 

接 下 来 , 语法 分 析 器 将 其 余 输 入 的 某 个 前 缀 归 约 成 为 5。 我 们 一 直 把 它 称 为 1, 以便 和 产生 
AKH S XPF o Sı. code 的 值 计算 完成 并 放 在 S 的 栈 记 录 中 。 这 个 步骤 对 应 于 图 5-37 所 示 的 
情形 。 

此 时 ,语法 分 析 器 将 把 从 while 到 51 的 全 部 内 容 归 约 为 S。 在 这 二 次 归 约 中 , 执行 的 代 
码 是 : 

tempCode = label || stackltop — 4].L1 || stack[top — 3].code || 
label || stack{top — 4].L2 || stack|top|.code; 


top = top — 6; 
stack{top|.code = tempCode; 


也 就 是 说 , 我 们 在 变量 tempCode 中 构造 出 S. code 的 值 。 该 代码 也 是 由 两 个 标号 L 和 [2、C 的 代 
TIM S, 的 代码 组 成 。 这 个 栈 执行 了 一 些 弹 出 操作 , 因此 5 出 现在 while 原来 出 现 的 地 方 。5 的 代 
码 值 存放 在 该 记录 的 code 字段 中 。 它 在 那里 被 解释 为 综合 属性 S. code WER, 我 们 在 这 次 讨 
论 中 没有 显示 对 LR 状态 的 操作 , 实际 上 这 些 状 态 必须 出 现在 栈 中 , 其 所 在 的 字段 就 是 存放 文法 
符号 的 字段 。 O 
5.5.5 5.5 节 的 练习 

练习 5. 5. 1: 按照 5.5.1 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 实现 为 递归 下 降 的 语法 
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分 析 器 。 
练习 5.5.2: 按照 5.5.2 节 的 风格 ;将 练习 5.4.4 中 得 到 的 每 个 SDD 实现 为 递归 下 降 的 语法 


分 析 器 。 

练习 5.5.3; 按照 5.5.3 节 的 风格 ; 将 练习 5.4.4 中 得 到 的 每 个 SDD 和 一 个 IL 语法 分 析 器 
一 起 实现 。 它 们 应 该 边 扫描 输入 边 生 成 代码 。 

练习 5. 5. 4: 按照 5.5.3 节 的 风格 , 将 练习 5.4. 4 中 得 到 的 每 个 SDD 和 一 个 IL 语法 分 析 器 
一 起 实现 , 但 是 代码 (或 者 指向 代码 的 指针 ) 存 放 在 栈 中 。 

A 5.5.5: 按照 5.5.4 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 和 一 个 LR 语法 分 析 器 
汪 起 实现 。 

练习 5. 5. 6: 按照 5.5.1 节 的 风格 实现 练习 5.2.4 中 得 到 的 SDD。 按 照 5.5.2 节 的 风格 得 到 
的 实现 和 这 个 实现 相 比 有 什么 不 同 吗 ? 


5.6 第 5 章 总 结 


继承 属性 和 综合 属性 : 语法 制导 的 定义 可 以 使 用 的 两 种 属性 。 一 棵 语法 分 析 树 结 点 上 的 
综合 属性 根据 该 结 点 的 子 结 点 的 属性 计算 得 到 。 一 个 结 点 上 的 继承 属性 根据 它 的 父 结 点 
和 /或 兄弟 结 点 的 属性 计算 得 到 。 

依赖 图 : 给 定 一 棵 语法 分 析 树 和 一 个 SDD, 我 们 在 各 个 语法 分 析 树 结 点 所 关联 的 属性 实 
例 之 间 画 上 边 ， 以 指明 位 于 边 的 头 部 的 属性 值 要 根据 位 于 边 的 尾部 的 属性 值 计 算得 到 。 
循环 定义 : 在 一 个 有 问题 的 SDD H, 我 们 发 现存 在 一 些 语法 分 析 树 ， 无 法 找到 一 个 顺序 
来 计算 所 有 结 点 上 的 所 有 属性 的 值 。 这 些 语法 分 析 树 关联 的 依赖 图 中 存在 环 。 确 定 一 个 
SDD 是 否 存 在 这 种 带 环 的 依赖 图 是 非常 困难 的 。 

S 属性 定义 : 在 一 个 S$ 属性 的 SDD F, 所 有 的 属性 都 是 综合 的 。 

L 属性 定义 : 在 一 个 工 属性 的 SDD 中 , 属性 可 能 是 继承 的 , 也 可 能 是 综合 的 。 然 而 , 一 个 
语法 分 析 树 结 点 上 的 继承 属性 只 能 依赖 于 它 的 父 结 点 的 继承 属性 和 位 于 它 左 边 的 兄弟 结 
点 的 (任意 ) 属 性 。 

抽象 语法 树 : 一 棵 抽象 语法 树 中 的 每 个 结 点 代表 一 个 构造 ; 某 个 结 点 的 子 结 点 表示 该 结 
点 所 对 应 的 构造 的 有 意义 的 组 成 部 分 。 

实现 S 属性 的 SDD: 一 个 S 属 性 定义 可 以 通过 一 个 所 有 动作 都 在 产生 式 尾部 的 SDT 后 绥 
SDT) 来 实现 。 这 些 动作 通过 产生 式 体 中 的 各 个 符号 的 综合 属性 来 计算 产生 式 头 的 综合 属 
性 。 如 果 基 础 文法 是 LR 的 , 那么 这 个 SDT 可 以 在 一 个 LR 语法 分 析 器 的 栈 上 实现 。 

从 SDT 中 消除 左 递归 : 如 果 一 个 SDT 只 有 副作用 ( 即 不 计算 属性 值 ), 那么 消除 文法 左 递 
归 的 标准 方法 允许 我 们 把 语义 动作 当 作 终结 符号 移动 到 新 文法 中 去 。 在 计算 属性 时 , 如 
果 这 个 SDT 是 后 级 SDT, 那么 我 们 仍然 能 够 消除 左 递 归 。 

用 递归 下 降 语 法 分 析 实 现 工 属性 的 SDD: 如 果 我 们 有 一 个 工 属性 定义 ,， 且 其 基础 文法 可 
以 用 自 项 向 下 的 方法 进行 语法 分 析 , 我 们 就 可 以 构造 出 一 个 不 带 回溯 的 递归 下 降 语 法 分 
析 器 来 实现 这 个 翻译 。 继 承 属性 变 成 了 非 终 结 符号 对 应 的 函数 的 参数 ， 而 综合 属性 由 该 
函数 返回 。 

实现 LL 文法 之 上 的 工 属性 的 SDD: 每 个 以 LL 文法 为 基础 文法 的 工 属 性 定义 可 以 在 语法 
分 析 过 程 中 实现 。 用 于 存放 一 个 非 终结 符号 的 综合 属性 的 记录 被 放 在 栈 中 这 个 非 终 结 符 
号 之 下 , 而 一 个 非 终结 符号 的 继承 属性 和 这 个 非 终结 符号 存放 在 一 起 。 栈 中 还 放置 了 动 
作 记 录 , 以 便 在 适当 的 时 候 计 算 属 性 值 。 
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® 以 自 底 向 上 的 方式 实现 一 个 在 LL 文法 之 上 的 工 属 性 SDD;: 一 个 以 LL 文法 为 基础 文法 的 
工 属性 定义 可 以 转换 成 一 个 以 LR 文法 为 基础 文法 的 翻译 方案 , 且 这 个 翻译 可 以 和 自 底 向 
上 的 语法 分 析 过 程 一 起 执行 。 文 法 的 转换 过 程 中 引信 了 “标记 ” 非 终结 符号 。 这 些 符号 出 
现在 自 底 向 上 语法 分 析 栈 中 ,并 保存 了 栈 中 位 于 它 上 方 的 非 终结 符号 的 继承 属性 ; 在 栈 
H, 综合 属性 和 它 的 非 终结 符号 放 在 一 起 。 
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在 编译 器 的 分 析 - 综合 模型 中 , 前 端 对 源 程序 进行 分 析 并 产生 中 间 表 示 , 后 端 在 此 基础 上 生 
成 目标 代码 。 理 想 情况 下 ， 和 源 语言 相关 的 细节 在 前 端 分 析 中 处 理 ， 而 关于 目标 机 器 的 细节 则 在 
后 端 处 理 。 基 于 一 个 适当 定义 的 中 间 表 示 形 式 , 可 以 把 针对 源 语言 i 的 前 端 和 针对 目标 机 带 j 的 
后 端 组 合 起 来 ,构造 得 到 源 语言 ;在 目标 机 器 7 上 的 一 个 编译 器 。 这 种 创建 编译 器 组 合 的 方法 可 
以 大 大 减少 工作 量 : 只 要 写 出 m 种 前 端 和 种 后 端 处 理 程序 , 就 可 以 得 到 mm xn 种 编译 程序 。 

本 章 的 内 容 涉 及 中 间 代 码 表 示 、 静 态 类 型 检查 和 中 间 代 码 生成 。 为 简单 起 见 , 我 们 假设 一 个 
编译 程序 的 前 端 处 理 按照 图 6-1 所 示 方 式 进行 组 织 , 顺序 地 进行 语法 分 析 、 静态 检查 和 中 间 代 码 
生成 a 有 时 候 这 几 个 过 程 也 可 以 组 合 起 来 , 在 语法 分 析 中 一 并 完成 。 我 们 将 使 用 第 2 章 和 第 5 章 
中 的 语法 制导 定义 来 描述 类 型 检查 和 翻译 过 程 。 大 部 分 的 翻译 方案 可 以 基于 第 5 章 中 给 出 的 自 
顶 向 下 或 自 底 向 上 的 语法 分 析 技 术 来 实现 。 所 有 的 方案 都 可 以 通过 生成 并 遍历 抽象 语法 树 来 


实现 。 
一 一 一 一 一 一 一 前 六 一 一 一 一 一 一 一 后 漠 一 一 一 
图 6-1 一 个 编译 器 前 端的 逻辑 结构 


静态 检查 包括 类 型 检查 (type checking), 类 型 检查 保证 运算 符 被 应 用 到 兼容 的 运算 分 量 。 静 
态 检 查 还 包括 在 语法 分 析 之 后 进行 的 所 有 语法 检查 。 例 如 ,静态 检查 保证 了 C 语言 中 的 一 条 
break 指令 必然 位 于 一 个 while/for/switch 语句 之 内 。 如 果 不 存在 这 样 的 语句 ,静态 检查 将 报告 一 
个 错误 。 

本 章 介绍 的 方法 可 以 用 于 多 种 中 间 表 示 , 包括 抽象 语法 树 和 三 地 址 代码 。 这 两 种 中 间 表 示 
方法 都 在 2. 8 节 中 介绍 过 。 之 所 以 名 为 “三 地 址 代码 ”, 是 因为 这 些 指令 的 一 般 形式 x = y op z RA 
三 个 地 址 : 两 个 运算 分 量 y Mz, 一 个 结果 变量 x, 

在 将 给 定 源 语言 的 一 个 程序 翻译 成 特定 的 目标 机 器 代码 的 过 程 中 , 一 个 编译 器 可 能 构造 出 
一 系列 中 间 表 示 , 如 图 6-2 所 示 。 高 层 的 表示 接近 于 源 语言 ,而 低层 的 表示 接近 于 目标 机 器 。 语 
法 树 是 高 层 的 表示 , 它 刻 画 了 源 程 序 的 自然 的 层次 性 结构 ， 并 且 适 用 于 静态 类 型 检查 这 样 的 
处 理 。 


高 层 中 低层 中 E 
Rah Aa... Loe mee S pa 
形式 形式 


6-2 ”编译 器 可 能 使 用 一 系列 的 中 间 表 示 


低层 的 表示 形式 适用 于 机 器 相关 的 处 理 任务 ， 比 如 寄存 器 分 配 、 指 令 选择 等 。 通 过 选择 不 同 
的 运算 符 , 三 地 址 代码 既 可 以 是 高 层 的 表示 方式 , 也 可 以 是 低层 的 表示 方式 。 在 6. 2. 3 WHA 
到 , 对 表达 式 而 言 , 语法 树 和 三 地 址 代码 只 是 在 表面 上 有 所 不 同 。 对 于 循环 语句 , 语法 树 表 示 了 
语句 的 各 个 组 成 部 分 ,而 三 地 址 代码 包含 标号 和 跳 转 指令 , 用 来 表示 目标 语言 的 控制 流 。 
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不 同 的 编译 器 对 中 间 表 示 的 选择 和 设计 各 有 不 同 。 中 间 表 示 可 以 是 一 种 真正 的 语言 , 也 可 
以 由 编译 器 的 各 个 处 理 阶 段 共享 的 多 个 内 部 数据 结构 组 成 。C 语言 是 一 种 程序 设计 语言 。 它 具 
有 很 好 的 灵活 性 和 通用 性 ,可 以 很 方便 地 把 C 程序 编译 成 高 效 的 机 器 代码 , 并 且 有 很 多 C 的 编译 
器 可 用 ,因此 C 语言 也 常常 被 用 作 中 间 表示 。 早 期 的 C ++ 编译 器 的 前 端 生 成 C 代码 , 而 把 C 纺 
译 器 作为 其 后 端 。 
6.1 语法 树 的 变 体 

语法 树 中 的 各 个 结 点 代表 了 源 程序 中 的 构造 ,一 个 结 点 的 所 有 子 结 点 反映 了 该 结 点 对 应 构 
造 的 有 意义 的 组 成 成 分 。 为 表达 式 构建 的 无 环 有 向 图 ( Directed Acyclic Graph, 以 后 简称 DAG) 指 
出 了 表达 式 中 的 公共 子 表达 式 (多 次 出 现 的 子 表达 式 ) 。 在 本 节 我 们 将 看 到 ,可 以 用 构造 语法 树 
的 技术 去 构造 DAG。 
6.1.1 ”表达 式 的 有 向 无 环 图 

和 表达 式 的 语法 树 类 似 , 一 个 DAG 的 叶子 结 点 对 应 于 原子 运算 分 量 , 而 内 部 结 点 对 应 于 运 
算 符 。 与 语法 树 不 同 的 是 ， 如 果 DAG 中 的 一 个 结 点 N 表示 二 个 公共 子 表达 式 ， 则 N 可 能 有 多 个 
父 结 点 。 在 语法 树 中 ,公共 子 表达 式 每 出 现 一 次 ,代表 该 公共 子 表达 式 的 子 树 就 会 被 复制 一 次 。 
因此 ，DAG 不仅 更 简洁 地 表示 了 表达 式 , 而 且 可 以 为 最 终生 成 表达 式 的 高 效 代码 提供 重要 的 
信息 。 
图 63 给 出 了 下 面 的 表达 式 的 DAG 


ata* (b-c) + (b-c) *d 


JEER : 
叶子 结 点 a 在 表达 式 中 出 现 了 两 次 , 因此 a 有 两 Se wa ~ 
个 父 结 点 。 值 得 注意 的 是 , BAS ”代表 公共 子 表达 2 
式 b-c 的 两 次 出 现 。 该 结 点 同样 有 两 个 父 结 点 , R FIR 
HAF RARE FRIAR a * (b-c)M(b-c)*d 
中 两 次 被 使 用 。 尽 管 p 和 在 整个 表达 式 中 出 现 了 两 。 图 63 getkst avae(b 2c) + 
次 , 但 它们 对 应 的 结 点 只 有 一 个 父 结 点 ,因为 对 它们 ee 
的 使 用 都 出 现在 同样 的 公共 子 表达 式 b-c HR. O 
图 6-4 给 出 的 SDD( 语 法 制导 定义 ) 既 可 以 用 来 构造 语法 树 , 也 可 以 用 来 构造 DAG。 它 在 例 
5. 11 中 曾 用 于 构造 语法 树 。 在 那里 , 函数 Leaf 和 Node 每 次 被 调用 都 会 构造 出 一 个 新 结 点 。 要 构 
造 得 到 DAG, 这 些 函 数 就 要 在 每 次 构造 新 结 点 之 前 首先 检查 是 否 已 存在 这 样 的 结 点 。 如 果 存 在 
一 个 已 被 创建 的 结 点 ， 就 返回 这 个 已 有 的 结 点 。 例 如 ， 在 构造 一 个 新 结 点 Node(op, left, right) 之 
前 , 我 们 首先 检查 是 否 已 存在 一 个 结 点 , 该 结 点 的 标号 为 op, 且 其 两 个 子 结 点 为 lef 和 right. 如 
果 存 在 这 样 的 结 点 ，Node 函数 返回 这 个 已 存在 的 结 点 ， 和 否则 它 创建 一 个 新 结 点 。 
[et 语义 规则 
1) E> Ek, +T E.node = new Node('+', E, :node, T.node) 
2) ESE, -T E.node = new Node('—', E, .node, T.node) 














3) E>T E.node = T.node 
T >T,*F T.node = new Node('*', T .node, F. node) 
4) TLE) T.node = E.node 
5) T >id T.node = new Leaf (id, id.entry) 
6) T > num T.node = new Leaf (num, num. val) 





图 6-4 生成 语法 树 或 DAG 的 语法 制导 定义 
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图 6.5 给 册 了 构造 图 6-3 所 示 DAG 的 各 个 步骤 。 如 上 所 述 ,函数 Node 和 Leaf IS] 
能 地 返回 已 存在 的 结 点 。 我 们 假设 entry-a 指向 符号 表 中 


pi = Leaf (id, entry-a) 


与 a 对 应 的 项 , 其 他 标识 符 的 处 理 方式 与 此 类 似 。 p2 = Leaf (id, entry-a) = pı 


当 在 第 2 步 再 次 调用 Leaf Cid, entry-a ) 时 ,函数 返回 ) p = Leaf (id, entry-b) 
pa = Leaf (id, entry-c) 
ps = Node('—', pa,p4) 


的 是 之 前 调用 生成 的 结 点 , 因此 p =Pi。 类 似 地 , 第 8 步 


和 第 9 步 返回 的 结 点 分 别 和 第 3 步 及 第 4 步 返 回 的 结 采 Pe = Ae etna 

x k = Node('+',pi, 
相同 ( 即 Ps Spy 9 Po apy) 9 同样 ， 第 10 步 返 回 的 结 点 必 a Leaf (id, A = ps 
然 和 第 5 步 中 返回 的 结 点 相同 , 即 pio =ps0 Oo Py = joh entry-¢) =p 
6.1.2 构造 DAG 的 值 编码 方法 tke ee Wn 


语法 树 或 DAG 图 中 的 结 点 通常 存放 在 一 个 记录 数组 piz = Node('s", ps, Pus) 
中 ,如 图 66 所 示 。 数 组 的 每 一 行 表示 一 个 记录 , 也 就 是 ail bi lat 
一 个 结 点 。 在 每 个 记录 中 , 第 一 个 字段 是 一 个 运算 符 代 图 65 图 6-3 所 示 的 DAG 的 构造 过 程 
码 也 是 该 结 点 的 标号 。 在 图 6-6b 中 , 各 个 叶子 结 点 还 

有 个 附加 的 字段 , 它 存放 了 标识 符 的 词法 值 (在 这 里 , 它 是 一 个 指向 符号 表 的 指针 或 一 个 党 
量 ) ， 内 部 结 点 则 有 两 个 附加 的 字段 ， 分 别 指明 其 左右 子 结 点 。 


z o 


a) DAG b) 数组 








图 6-6 i=i+10 H DAG 的 结 点 在 数组 中 的 表示 


在 这 个 数组 中 , 我 们 只 需要 给 出 一 个 结 点 对 应 的 记录 在 此 数组 中 的 整数 下 标 就 可 以 引用 该 
结 点 。 在 历史 上 , 这 个 整数 称 为 相应 结 点 或 该 结 点 所 表示 的 表达 式 的 值 编码 (value number) o 例 
如 , 在 图 6-6 中 , 标号 为 “+” 的 结 点 的 值 编码 为 3, 其 左右 子 结 点 的 值 编码 分 别 为 1 和 2。 在 实践 
中 , 我 们 可 以 用 记录 指针 或 对 象 引用 来 代替 整数 下 标 , 但 是 我 们 仍然 把 一 个 结 点 的 引用 称 为 该 结 
点 的 “ 值 编码 ”"。 如 果 使 用 适当 的 数据 结构 , 值 编码 可 以 帮助 我 们 高 效 地 构造 出 表达 式 的 DAG, 
下 一 个 算法 将 给 出 构造 的 方法 。 

假定 结 点 按照 如 图 6-6 所 示 的 方式 存放 在 一 个 数组 中 , 每 个 结 点 通过 其 值 编码 引用 。 设 每 个 
内 部 结 点 的 范 型 为 三 元 组 <op, l, r>, 其 中 op 是 标号 , | 是 其 左 子 结 点 对 应 的 值 编码 , r 是 其 右 
子 结 点 对 应 的 值 编码 。 假 设 单 目 运算 符 对 应 的 结 点 有 r=0。 

ESCAI 构造 DAG 的 结 点 的 值 编 码 方法 。 

输入 : 标号 op. Hix | 和 结 点 re 

输出 : 数组 中 具有 三 元 组 <op, l, "> 形式 的 结 点 的 值 编码 。 

方法 : 在 数组 中 搜索 标号 为 op、 左 子 结 点 为 1 且 右 子 结 点 为 7 的 结 点 NM。 如 果 存 在 这 样 的 结 
点 , 则 返回 用 结 点 的 值 编码 。 若 不 存在 这 样 的 结 点 , 则 在 数组 中 添加 一 个 结 点 N， 其 标号 为 op， 
左右 子 结 点 分 别 为 1 和 7, 返回 新 建 结 点 对 应 的 值 编码 。 口 

虽然 算法 6.3 可 以 产生 我 们 期 待 的 输出 结果 , 但 是 每 次 定位 一 个 结 点 时 都 要 搜索 整个 数组 ， 
这 个 开销 是 很 大 的 ， 当 数组 中 存放 了 整个 程序 的 所 有 表达 式 时 尤其 如 此 。 更 高 效 的 方法 是 使 用 
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散 列表 ; 将 结 点 放 人 若干 “ 桶 ”中 ,每 个 桶 通常 只 包含 少量 结 点 。 散 列表 是 能 够 高 效 支持 词典 
(dictionary) 功能 的 少数 几 个 数据 结构 之 一 2。 词 典 是 一 种 抽象 的 数据 类 型 ， 它 可 以 插入 或 删除 一 
个 集合 中 的 元 素 , 可 以 确定 一 个 给 定 元 素 当 前 是 否 在 集合 中 。 类 似 于 散 列 表 这 样 为 词典 设计 的 
优秀 数据 结构 可 以 在 常数 或 接近 常数 的 时 间 内 完成 上 述 的 操作 ,所 需 时 间 和 集合 的 大 小 无 关 。 

要 给 DAG 中 的 结 点 构造 散 列 表 , 首先 需要 建立 散 列 函数 (hash function)h。 这 个 函数 为 形 如 
<op, l, r> 的 三 元 组 计算 “ 桶 ”的 索引 。 它 通过 计算 索引 把 三 元 组 分 配 到 各 个 桶 中 ,并 使 得 不 大 
可 能 存在 某 个 “ 桶 ”的 元 组 数量 大 大 超过 平均 数 很 多 。 通 过 对 op. lr 的 计算 , 可 以 确定 地 得 到 桶 
Bal h(op, l, +r)。 因 而 我 们 可 以 多 次 重复 这 个 计算 过 程 ， 总 是 得 到 结 点 < op, 1, r> 的 相同 的 桶 
索引 。 

桶 可 以 通过 链表 来 实现 , 如 图 6-7 所 示 。 一 个 由 散 列 值 索引 的 数组 保存 桶 的 头 (bucket head- 
er) 。 每 个 头 指 向 列表 中 的 第 一 个 单元 。 在 一 个 桶 的 链表 中 , 链表 的 各 个 单元 记录 了 某 个 被 散 列 
函数 分 配 到 此 桶 中 的 某 个 结 点 的 值 编码 。 也 就 是 说 , 在 以 数组 的 第 h(op, 1, r) 个 元 素 为 头 的 链 
表 中 可 以 找到 结 点 <op, l, r>o 





olua 表示 结 点 


的 元 素 链表 


以 散 列 值 为 素 “9| ”一 
引 的 桶 头 的 数组 


6-7“ 用 于 搜索 桶 的 数据 结构 


因此 , 给 定 一 个 输入 结 点 (op, 1, r) ,我们 首先 计算 桶 索引 h(op, l, r)， 然 后 在 该 桶 的 单元 中 
搜索 这 个 结 点 。 通 常情 况 下 有 足够 多 的 桶 ,因此 链表 中 不 会 有 很 多 单元 。 然 而 , 我 们 必须 查看 一 
个 桶 中 的 所 有 单元 , 并且 对 于 每 一 个 单元 中 的 值 编 码 ", 我 们 必须 检查 输入 结 点 的 三 元 组 op, I, 
r> 是 否 和 单元 列表 中 值 编码 为 v 的 结 点 相 匹配 (如 图 6-7 所 示 )。 如 果 我 们 找到 了 匹配 的 结 点 ， 
就 返回 v。 如 果 没 有 找到 匹配 的 结 点 ,我 们 知道 其 他 桶 中 也 不 会 有 这 样 的 结 点 。 因 此 , 我 们 就 创 
建 一 个 新 的 单元 , 添加 到 “ 桶 ”索引 为 (op, L, 7) 的 单元 链表 中 , 并 返回 新 建 结 点 对 应 的 值 编码 。 
6.1.3 6.1 节 的 练习 

练习 6. 1. 1: 为 下 面 的 表达 式 构造 DAG 

((mtr hrs (my) yom) ) eC (vt) © Cr ~ 9) ) 
练习 6. 1.2: 为 下 列表 达 式 构造 DAG, 且 指 出 它们 的 每 个 子 表达 式 的 值 编码 。 假 定 + 是 左 结 


合 的 。 
1) a+b+(a+6) 


2)a+b+a+b 


3)a+a+(a+a+a+(a+a+a+a)) 


© Bl Aho, A. V. . J. E. Hopcroft #il J. D. Ullman 所 著 的 《数据 结构 与 算法 》( Data Structures and Algorithms, Addison- 
Wesley 出 版 社 1983 年 出 版 ) 。 其 中 有 关于 支持 词典 功能 的 数据 结构 的 讨论 。 
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6.2 三 地 址 代码 


在 三 地 址 代码 中 , 一 条 指令 的 右 侧 最 多 有 一 个 运算 符 。 也 就 是 说 , 不 允许 出 现 组 合 的 算术 表 
达 式 。 因 此 , 像 x +y * z 这 样 的 源 语言 表达 式 要 被 翻译 成 如 下 的 三 地 址 指令 序列 。 


ty =y kz 
ty = a+ tj 


其 中 ti Mt, 是 编译 器 产生 的 临时 名 字 。 因 为 三 地 址 代码 拆 分 了 多 运算 符 算术 表达 式 以 及 控制 
流 语句 的 骨 套 结构 , 所 以 适用 于 目标 代码 的 生成 和 优化 。 具 体 的 过 程 将 在 第 8、9 章 中 详细 介绍 。 
因为 可 以 用 名 字 来 表示 程序 计算 得 到 的 中 间 结 果 , 所 以 三 地 址 代码 可 以 方便 地 进行 重组 。 

网 有 区 有 三 地 址 代码 是 一 棵 语法 树 或 一 个 DAG 的 线性 表示 形式 。 三 地 址 代码 中 的 名 字 对 应 于 
图 中 的 内 部 结 点 。 图 6-8 中 再 次 给 出 了 图 6-3 中 的 DAC, 以 及 该 图 对 应 的 三 地 址 代码 序列 。 O 
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a) DAG b) 三 地 址 代码 


图 6-8 一 个 DAG 及 其 对 应 的 三 地 址 代码 


6.2.1 地 址 和 指令 
三 地 址 代码 基于 两 个 基本 概念 : 地 址 和 指令 。 按 照 面向 对 象 的 说 法 , 这 两 个 概念 对 应 于 两 个 
K, 而 各 种 类 型 的 地 址 和 指令 对 应 于 相应 的 子 类 。 另 一 种 方法 是 用 记录 的 方式 来 实现 三 地 址 代 
码 , 记录 中 的 字段 用 来 保存 地 址 。6. 2. 2 节 将 简要 介绍 被 称 为 四 元 式 和 三 元 式 的 记录 表示 方式 。 
地 址 可 以 具有 如 下 形式 之 一 : 
© 名 字 。 为 方便 起 见 ， 我 们 允许 源 程序 的 名 字 作 为 三 地 址 代码 中 的 地 址 。 在 实现 中 , 源 程 
序 名 字 被 蔡 换 为 指向 符号 表 条 目的 指针 。 关 于 该 名 字 的 所 有 信息 均 存 放 在 该 条 目 中 。 
。 常量 。 在 实践 中 , 编译 器 往往 要 处 理 很 多 不 同类 型 的 常量 和 变量 。6. 5. 2 节 将 考虑 表达 式 
中 的 类 型 转换 问题 。 
e 编译 器 生成 的 临时 变量 。 在 每 次 需要 临时 变量 时 产生 一 个 新 名 字 是 必要 的 , 在 优化 编译 
器 中 更 是 如 此 。 当 为 变量 分 配 寄 存 器 的 时 候 , 我 们 可 以 尽 可 能 地 合并 这 些 临 时 变量 。 
下 面 我 们 介绍 本 书 的 其 余部 分 常用 的 几 种 三 地 址 指令 。 改 变 控制 流 的 指令 将 使 用 符号 化 标 
号 。 每 个 符号 化 标号 表示 指令 序列 中 的 二 条 三 地 址 指令 的 序号 。 通 过 一 次 扫描 , 或 者 通过 回填 
技术 就 可 以 把 符号 化 标号 替换 为 实际 的 指令 位 置 。 回 填 技 术 将 在 6.7 节 中 讨论 。 下 面 给 出 几 种 
常见 的 三 地 址 指令 形式 : 
1) 形 如 *=yopz 的 赋值 指令 , 其 中 op 是 一 个 双 目 算术 符 或 逻辑 运算 符 。x、y、z 是 地 址 。 
2) 形 如 *=opy 的 赋值 指令 , 其 中 op 是 单 目 运算 符 。 基 本 的 单 目 运算 符 包括 单 目 减 、 人 逻辑 非 
和 转换 运算 。 将 整数 转换 成 浮 点 数 的 运算 就 是 转换 运算 的 一 个 例子 。 
3) 形 如 x=y 的 复制 指令 , CIE y HARA xo 
4) 无 条 件 转移 指令 goto L, 下 一 步 要 执行 的 指令 是 带 有 标号 工 的 三 地 址 指令 。 
5) 形 如 if x gotoL Rif False x goto 大 的 条 件 转移 指令 。 分 别 当 xy 为 真 或 为 假 时 , 这 
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两 个 指令 的 下 一 步 将 执行 带 有 标号 工 的 指令 。 否则 下 一 步 将 照常 执行 序列 中 的 后 一 条 指令 。 

6) 形 如 if x relop y goto L 的 条 件 转移 指令 。 它 对 x 和 y 应 用 一 个 关系 运算 符 ( <, ==, 
>= 等 )。 如 果 x 和 yy 之 间 满 足 relop 关系 ， 那么 下 一 步 将 执行 带 有 标号 工 的 指令 , 否则 将 执行 指令 
序列 中 跟 在 这 个 指令 之 后 的 指令 。 

7) 过 程 调用 和 返回 通过 下 列 指令 来 实现 : param x 进行 参数 传递 , call p, n 和 y= call p， 
n 分 别 进行 过 程 调用 和 函数 调用 ; return y 是 返回 指令 , 其 中 y 表示 返回 值 , 该 指令 是 可 选 的 。 
这 些 三 地 址 指令 的 常见 用 法 见 下 面 的 三 地 址 指令 序列 


param Tı 
param t2 


param Zn 
call. ip, 7. 


它 是 过 程 p(x1， 057° on) 的 调用 的 一 部 分 。“ call p, n” PH n 是 实在 参数 的 个 数 。 这 个 nn 并 
不 是 宛 余 的 ， 因 为 存在 入 套 调用 的 情况 。 也 就 是 说 , 前 面 的 一 些 param 语句 可 能 是 p 返回 之 后 
才 执 行 的 某 个 函数 调用 的 参数 , 而 p 的 返回 值 又 成 为 这 个 后 续 函 数 调 用 的 另 一 个 参数 。 过 程 调用 
的 实现 将 在 6. 9 节 中 加 以 介绍 。 

8) 带 下 标的 复制 指令 x=y[ 让 和 x[ 让 =y。x=y[ 让 指令 将 把 距离 位 置 y 处 i 个 内 存单 元 的 位 
置 中 存放 的 值 赋 给 x。 指 令 x[ 让 =y 将 距离 位 置 * 处 i 个 内 存单 元 的 位 置 中 的 内 容 设置 为 y 的 值 。 

9) 形 如 x=@y、x= *y 或 %x=y 的 地 址 及 指针 赋值 指令 。 指 令 * = &y x AEREN y 
的 地 址 ( 左 值 )S。 这 个 y 通常 是 一 个 名 字 , 也 可 能 是 一 个 临时 变量 。 它 表示 一 个 诸如 AL i][j] 
这 样 具 有 左 值 的 表达 式 。x 是 一 个 指针 名 字 或 临时 变量 。 在 指令 x = *y 中， 假定 7y 是 一 个 指针 ， 
或 是 一 个 其 右 值 表 示 内 存 位 置 的 临时 变量 。 这 个 指令 使 得 * 的 右 值 等 于 存储 在 这 个 位 置 中 的 值 。 
最 后 , 指令 *%=y 则 把 y 的 右 值 赋 给 由 x 指向 的 目标 的 右 值 。 
考虑 语句 

do i = iti; while (ali] < v); i 
图 6-9 给 出 了 这 个 语句 的 两 种 可 能 的 翻译 。 在 图 6-9a 的 翻译 中 ， 第 一 条 指令 上 附加 了 一 个 符号 化 
标号 5。 图 6.9b 中 的 翻译 显示 了 每 条 指令 的 位 置 号 , 我 们 在 图 中 选择 以 100 作为 开始 位 置 。 在 两 
种 翻译 中 ,最 后 一 条 指令 都 是 目标 为 第 一 条 指令 的 条 件 转移 指令 。 乘 法 运算 i *8 适用 于 每 个 元 
素 占 8 个 存储 单元 的 数组 。 oO 











tysia tod 


if t3°<\v goto L if tz; < v goto 100 





a) 符号 标号 b) 位 置 号 
图 6-9 给 三 地 址 指令 指定 标号 的 两 种 方法 
选择 使 用 哪些 运算 符 是 中 间 表 示 形 式 设计 的 一 个 重要 问题 。 显 然 , 这 个 运算 符 集合 中 的 运 


算 符 要 足够 丰富 ,以 便 实 现 源 语言 中 的 所 有 运算 。 接 近 机 器 指令 的 运算 符 可 以 使 在 目标 机 器 上 实 = 
. 现 中 间 表 示 形 式 更 加 容易 。 然 而 ,如果 前 端 必须 为 某 些 源 语言 运算 生成 很 长 的 指令 序列 ,那么 优 





O 2.8.3 节 曾经 提出 , 左 值 和 右 值 分 别 表示 赋值 左 / 右 部 。 
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化 器 和 代码 生成 器 就 需要 花费 更 多 的 时 间 去 重新 发 现 程序 的 结构 ， 然 后 才能 为 这 些 运算 生成 高 
质量 的 目标 代码 。 
6. 2.2 四 元 式 表 示 

上 面 对 三 地 址 指令 的 描述 详细 说 明了 各 类 指令 的 组 成 部 分 , 但 是 并 没有 描述 这 些 指令 在 某 
个 数据 结构 中 的 表示 方法 。 在 编译 器 中 , 这 些 指令 可 以 实现 为 对 象 , 或 者 是 带 有 运算 符 字 段 和 运 
算 分 量 字 段 的 记录 。 四 元 式 、 三 元 式 和 间接 三 元 式 是 三 种 这 样 的 描述 方式 。 

一 个 四 元 式 (quadruple) 有 四 个 字段 , FATA APRA op. arg). argy, result, 字段 op 包含 一 个 
运算 符 的 内 部 编码 。 举 例 来 说 , 在 三 地 址 指令 x =y +z 相应 的 四 元 式 中 ,op 字段 中 存放 + arg, 
中 为 y, arg, PX z, result 中 为 x。 下 面 是 这 个 规则 的 一 些 特例 : 

1) 形 如 x = minus y 的 单 目 运算 符 指令 和 赋值 指令 x =y 不 使 用 arg,。 注 意 , WFR x ay 这 
样 的 赋值 语句 , op =, 而 对 大 部 分 其 他 运算 而 言 , 赋值 运算 符 是 隐 含 表示 的 。 

2) 像 param 这 样 的 运算 既 不 使 用 arg, , 也 不 使 用 resulto 

3) 条 件 或 非 条 件 转 移 指 令 将 目标 标号 放 入 result 字段 。 
赋值 语句 a =b* -c+b* -c 的 三 地 址 代码 如 图 6-10a 所 示 。 这 里 我 们 使 用 特殊 的 
minus 运算 符 来 表示 “=<c” 中 的 单 目 减 运算 符 ”-”, 以 区 别 于 “b -c” 中 的 双 目 减 运算 符 ” - ”。 
请 注意 , 单 目 减 的 三 地 址 语句 中 只 有 两 个 地 址 , 复制 语句 a =ts 也 是 如 此 。 



































:图 6-10b 描述 了 实现 图 6-10a 中 三 地 址 代码 的 四 元 式 序列 。 oO 

op arg, arg, result 

t; = minus c 0[minus;, c , j tı 

to = b * ty Vie Be tan te 

t3 = minus c 2 minus | e, i t3 

ta = b * t3 3 t bee t 

Ce = bo r VA 4 下 nea ts 

a = ts 5 = ý ts i j a 

a) 三 地 址 代码 b) 四 元 式 


图 6-10 三 地 址 代码 及 其 四 元 式 表示 


为 了 提高 可 读 性 , 我 们 在 图 6-10b 中 直接 用 实际 标识 符 , 比如 用 a, b, c 来 描述 arg, , arg, 以 
及 result 字段 , 而 没有 使 用 指向 相应 符号 表 条 目的 指针 。 临 时 名 字 可 以 像 程 序 员 定义 的 名 字 一 样 
被 加 入 到 符号 表 中 , 也 可 以 实现 为 Temp 类 的 对 象 , 这 个 Temp 类 有 自己 的 方法 。 

6.2.3 三 元 式 表 示 ’ 

一 个 三 元 式 (triple) 只 有 三 个 字段 , 我 们 分 别称 之 为 op、argl 和 arg,。 请 注意 , 图 6-10b 中 的 
result 字 段 主 要 被 用 于 临时 变量 名 。 使 用 三 元 式 时 , 我 们 将 用 运算 x op y 的 位 置 来 表示 它 的 结果 ， 
而 不 是 用 一 个 显 式 的 临时 名 字 表 示 。 例 如 , 在 三 元 式 表 示 中 将 直接 用 位 置 (0) , 而 不 是 像 图 6-10b 
中 那样 用 临时 名 字 ti 来 表示 对 相应 运算 结果 的 引用 。 带 有 括号 的 数字 表示 指向 相应 三 元 式 结构 
的 指针 。 在 6. 1.2 节 中 , 位 置 或 指向 位 置 的 编码 被 称 为 值 编码 。 

三 元 式 基 本 上 和 算法 6.3 中 的 结 点 范 型 等 价 。 因 此 , 表达 式 的 DAG 表示 和 三 元 式 表 示 是 等 
价 的 。 当 然 这 种 等 价 关 系 仅 对 表达 式 成 立 , 因为 语法 树 的 变 体 和 三 地 址 代码 分 别 以 完全 不 同 的 
方式 来 表示 控制 流 。 

UREA 图 6-11 中 给 出 的 语法 树 和 三 元 式 表 示 对 应 于 图 6-10 中 的 三 地 址 代码 及 四 元 式 序列 。 
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在 图 6-11b 给 出 的 三 元 式 表示 中 , 复制 语句 a = ts 按照 下 列 方式 表示 为 一 个 三 元 式 ; 在 字段 arg, 
中 放置 a, 而 在 字段 arg, 中 放置 三 元 式 位 置 的 值 编码 (4) 。 E 
像 *[i] =y 这 样 的 三 元 运算 在 三 元 式 结构 中 需要 两 个 条 目 。 例如 ,我 们 可 以 把 x 和 ;i 置 于 一 
个 三 元 式 中 ,并 把 y 置 于 另 一 个 三 元 式 中 。 类 似 的 , 我 们 可 以 把 x =y[i] 看 成 是 两 条 指令: =yli] 
和 w=t, 从 而 用 三 元 式 实现 这 个 语句 。 其 中 的 上 是 编译 器 生成 的 临时 变量 。 请 注意 , 实际 上 4 是 
不 会 出 现在 三 元 式 中 的 ， 因为 在 三 元 式 结构 中 是 通过 相应 三 元 式 结构 的 位 置 来 引用 临时 值 的 。 








为 什么 我 们 需要 复制 指令 ? 
如 图 6-10a 所 示 , 一 个 简单 的 翻译 表达 式 的 算法 往往 会 为 赋值 运算 生成 复制 指令 。 在 该 图 
中 ,我 们 将 ts 复制 给 a, 而 不 是 直接 将 to +t, MRA a, 通常 ,每 个 子 表达 式 都 会 有 一 个 它 自 
己 的 新 临时 变量 来 存放 运算 结果 。 只 有 当 处 理 赋值 运算 符 = 时 ,我 们 才 知 道 将 把 整个 表达 式 
的 结果 赋 到 哪里 。 一 个 代码 优化 过 程 将 会 发 现 ts 可 以 被 替换 为 a。 这 个 优化 过 程 可 能 使 用 
6.1.1 节 中 描述 的 DAG 作为 中 间 表 示 形 式 。 
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a) 语法 树 b) Sorex 


图 6-11 a=b*« -c+b* -c 的 表示 


在 优化 编译 器 中 , 由 于 指令 的 位 置 常常 会 发 生变 化 ， 四 元 式 相对 于 三 元 式 的 优势 就 体现 出 来 
了 。 使 用 四 元 式 时 ,如 果 我 们 移动 了 一 个 计算 临时 变量 ; 的 指令 ， 那些 使 用 i 的 指令 不 需要 做 任 
何 改 变 。 而 使 用 三 元 式 时 ， 对 于 运算 结果 的 引用 是 通过 位 置 完 成 的 ， 因此 如 果 改 变 一 条 指令 的 位 
E, 则 引用 该 指令 的 结果 的 所 有 指令 都 要 做 相应 的 修改 。 使 用 下 面 将 要 介绍 的 间接 三 元 式 时 就 
不 会 出 现 这 个 问题 。 

间接 三 元 式 ( indirect triple) 包 含 了 一 个 指向 三 元 式 的 指针 的 列表 ， 而 不 是 列 出 三 元 式 序列 本 
身 。 例 如 , 我 们 可 以 使 用 数组 instruction 按照 适当 的 顺序 列 出 指向 三 元 式 的 指针 。 这 样 , 图 6-11b 
中 的 三 元 式 序列 就 可 以 表示 成 为 图 6-12 所 示 的 形式 。 


instruction Op Qarg! Qarg» 
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图 6-12 三 地 址 代码 的 间接 三 元 式 表示 
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使 用 间接 三 元 式 表示 方法 时 ,优化 编译 器 可 以 通过 对 instruction 列表 的 重新 排序 来 移动 指令 
的 位 置 ,但 不 影响 三 元 式 本 身 。 在 用 Java 实现 时 ,一 个 指令 对 象 的 数组 和 间接 三 元 式 表 示 类 似 ， 
因为 Java 将 数组 元 素 作为 对 象 引用 来 处 理 。 
6.2.4 “静态 单 赋值 形式 

静态 单 赋值 形式 (SSA) 是 另 一 种 中 间 表示 形式 , 它 有 利于 实现 某 些 类 型 的 代码 优化 。SSA 和 
三 地 址 代码 的 区 别 主要 体现 在 两 个 方面 。 首 先 ,SSA 中 的 所 有 
赋值 都 是 针对 具有 不 同名 字 的 变量 的 , 这 也 是 “静态 单 赋值 "这 
一 名 字 的 由 来 。 图 6-13 给 出 了 分 别 以 三 地 址 代码 形式 和 静态 音 
赋值 形式 表示 的 中 间 程 序 。 注 意 , SSA 表示 中 对 变量 和 a 的 
每 次 定 值 都 以 不 同 的 下 标 加 以 区 分 。 

在 一 个 程序 中 , 同一 个 变量 可 能 在 两 个 不 同 的 控制 流 路 径 a) 三 地 址 代码 
中 被 定 值 。 例 如 , 下列 源 程序 


if ( flag ) n=-1; else x = i; 
y=x* a; 


中 , s 在 两 个 不 同 的 控制 流 路 径 中 被 定 值 。 如 果 我 们 对 条 件 语句 
的 真 分 支 和 假 分 支 中 的 x 使 用 不 同 的 变量 名 , 那么 我 们 应 该 在 
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赋值 运算 y =x * a 中 使 用 哪个 名 字 ? 这 也 是 SSA 的 第 二 个 特别 Qe MEes: 
之 处 。SSA 使 用 一 种 被 称 为 p 函数 的 表示 规则 将 x 的 两 处 定 值 ”图 6-13 三 地 址 代码 形式 和 
合并 起 来 ; SSA 形式 的 中 间 程 序 

if ¢ flag) xj = <1; else xy = 1; 


x3 = (x1, x2); 

如 果 控 制 流 经 过 这 个 条 件 语句 的 真 分 支 , $(xi， xz ) 的 值 为 xi BW, 如 果 控 制 流 经 过 假 分 
支 , 4 函数 的 值 为 xs 。 也 就 是 说 , 根据 到 达 包 含 $ 函 数 的 赋值 语句 的 不 同 控制 流 路 径 , $ 函 数 返 回 
不 同 的 参数 值 。 
6.2.5 6.2 节 的 练习 

练习 6. 2. 1 : 将 算术 表达 式 a + - (b +c) 翻 译 成 

1) 抽象 语法 树 

2) 四 元 式 序列 

3) 三 元 式 序列 

4) 间接 三 元 式 序列 

练习 6. 2.2; 对 下 列 赋值 语句 重复 练习 ,6.2. 1。 

1) a = bli) + celj] 

2) ali] = b*e - bed 

3) x = f(y+1) + 2 

4)x = *p + ky 

| 练习 6. 2.3: 说 明 如 何 对 一 个 三 地 址 代码 序列 进行 转换 , 使 得 每 个 被 定 值 的 变量 都 有 了 唯一 
的 变量 名 。 


6.3 ”类 型 和 声明 


可 以 把 类 型 的 应 用 划分 为 类 型 检查 和 翻译 : 
© 类 型 检查 (type checking) 。 类 型 检查 利用 一 组 逻辑 规则 来 推理 一 个 程序 在 运行 时 刻 的 行 
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为 。 更 明确 地 讲 , 类 型 检查 保证 运算 分 量 的 类 型 和 运算 符 的 预期 类 型 相 匹 配 。 例如 ，Java 
要 求 && 运算 符 的 两 个 运算 分 量 必须 是 boolean 型 。 如 果 满足 这 个 条 件 , 结果 也 具有 boolean 
类 型 。 
e 翻译 时 的 应 用 (translation application)。 根 据 一 个 名 字 的 类 型 , 编译 器 可 以 确定 这 个 名 字 
在 运行 时 刻 需要 多 大 的 存储 空间 。 类 型 信息 还 会 在 其 他 很 多 地 方 被 用 到 , 包括 计算 一 个 
数组 引用 所 指示 的 地 址 , 插入 显 式 的 类 型 转换 , 选择 正确 版 本 的 算术 运算 符 ; 等 等 。 
在 这 一 节 中 , 我 们 将 考虑 在 某 个 过 程 或 类 中 声明 的 名 字 的 类 型 及 存储 空间 布局 问题 。 一 个 
过 程 调用 或 对 象 的 实际 存储 空间 是 在 运行 时 刻 ( 当 该 过 程 被 调用 或 该 对 象 被 创建 时 ) 进行 分 配 的 。 
然而 ， 当 我 们 在 编译 时 刻 检查 局 部 声明 时 , 可 以 进行 相对 地 址 (relative address) 的 布局 ,一 个 名 字 
或 某 个 数据 结构 分 量 的 相对 地 址 是 指 它 相 对 于 数据 区 域 开始 位 置 的 偏 移 量 。 
6.3.1 类 型 表达 式 
类 型 自身 也 有 结构 , 我 们 使 用 类 型 表达 式 (type expression) 来 表示 这 种 结构 : 类 型 表达 式 可 能 
是 基本 类 型 , 也 可 能 通过 把 被 称 为 类 型 构造 算 子 的 运算 符 作 用 于 类 型 表达 式 而 得 到 。 基 本 类 型 
的 集合 和 类 型 构造 算 子 根据 被 检查 的 具体 语言 而 定 。 
数组 类 型 int[ 2 ] [3 ] 表 示 “ 由 两 个 数组 组 成 的 数组 ,其 中 的 每 个 数组 各 包含 3 个 束 
数 ”。 它 的 类 型 表达 式 可 以 写成 array (2, array(3, inte- PR 
ger) ) 。 该 类 型 可 以 用 如 图 6-14 所 示 的 树 来 描述 。array ; 
运算 符 有 两 个 参数 : 一 个 数字 和 一 个 类 型 。 E 
我 们 将 使 用 如 下 的 类 型 表达 式 的 定义 : 
。 基 本 类 型 是 一 个 类 型 表达 式 。 一 种 语言 的 基本 类 图 6-14 int[2][3] 的 类 型 表达 式 
型 通常 包括 boolean, char , integer, float 和 void。 最 后 一 个 类 型 表示 “没有 值 ”。 
。 类 名 是 一 个 类 型 表达 式 。 
。 将 类 型 构造 算 子 array 作用 于 一 个 数字 和 一 个 类 型 表达 式 可 以 得 到 一 个 类 型 表达 式 。 
© 一 个 记录 是 包含 有 名 字段 的 数据 结构 。 将 record 类 型 构造 算 子 应 用 于 字段 名 和 相应 的 类 
型 可 以 构造 得 到 一 个 类 型 表达 式 。 在 6. 3. 6 节 中 , 记录 类 型 的 实现 方法 是 把 构造 算 子 re- 
cord 应 用 于 包含 了 各 个 字段 对 应 条 目的 符号 表 。 
© 使 用 类 型 构造 算 子 一 可 以 构造 得 到 函数 类 型 的 类 型 表达 式 。 我 们 把 “从 类 型 * 到 类 型 ;的 
函数 "写成 :一 io。 在 6.5 节 中 讨论 类 型 检查 时 ,函数 类 型 是 有 用 的 。 
o 如 果 s Ale 是 类 型 表达 式 , 则 其 笛 卡 儿 积 s xt 也 是 类 型 表达 式 。 引 入 笛 卡 儿 积 主要 是 为 了 
保证 定义 的 完整 性 。 它 可 以 用 于 描述 类 型 的 列表 或 元 组 (例如 , 用 于 表示 函数 参数 ) 。 我 
们 假定 x 具有 左 结合 性 , 并 且 其 优先 级 高 于 一 。 
e 类 型 表达 式 可 以 包含 取 值 为 类 型 表达 式 的 变量 。 在 6. 5. 4 节 中 将 用 到 编译 器 产生 的 类 型 
变量 。 
图 是 表示 类 型 表达 式 的 一 种 比较 方便 的 方法 。 可 以 修改 6. 1. 2 节 中 给 出 的 值 编码 方法 , 以 构 
造 一 个 类 型 表达 式 的 DAG。 图 的 内 部 结 点 表示 类 型 构造 算 子 ,而 叶子 结 点 是 基本 类 型 、 类 型 名 或 
类 型 变量 。6. 1. 4 给 出 了 一 棵 树 的 实例 9 。 





integer 





O 类 型 名 代表 类 型 表达 式 ， 因 此 可 能 形成 隐 式 的 环 ， 见 “类 型 名 和 递归 类 型 " 部分。 如果 到 达 类 型 名 的 边 被 重 定向 到 
该 名 字 对 应 的 类 型 表达 式 , 那么 得 到 的 图 中 就 可 能 因为 存在 递归 类 型 而 出 现 环 。 
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类 型 名 和 递归 类 型 
在 C++ 和 Java 中, 类 一 旦 被 定义 , 其 名 字 就 可 以 被 用 来 表示 类 型 名 。 例 如 , 考虑 下 列 程 
序 片 段 中 的 Node 类 。 


public class Node {--- } 


pantie Node n; 
类 型 名 还 可 以 用 来 定义 递归 类 型 ,在 像 链表 这 样 的 数据 结构 中 要 用 到 递归 类 型 。 一 个 列表 元 
素 的 伪 代 码 如 下 : 


class Cell { int, info; (Cell: next; =} 
它 定义 了 一 个 递归 类 型 cells 这 个 类 包括 一 个 info 字段 和 男 一 个 Cell 类 型 的 字段 next。 
在 C 中 可 以 通过 记录 和 指针 来 定义 类 似 的 递归 类 型 。 本 章 介 绍 的 技术 也 适用 于 递归 类 型 。 














6.3.2 ”类 型 等 价 

两 个 类 型 表达 式 什 么 时 候 等 价 呢 ? 很 多 类 型 检查 规则 具有 这 样 的 形式 ,“ 如 果 两 个 类 型 表达 
式 相 等 , 那么 返回 某 种 类 型 , 否则 出 错 ”。 当 给 一 些 类 型 表达 式 命 名 , 并 且 这 些 和 名 字 在 之 后 的 其 
他 类 型 表达 式 中 使 用 时 就 可 能 会 产生 歧义 。 关 键 问题 在 于 一 个 类 型 表达 式 中 的 名 字 是 代表 它 自 
身 呢 , 还 是 被 看 作 另 一 个 类 型 表达 式 的 一 种 缩写 形式 。 

当 用 图 来 表示 类 型 表达 式 的 时 候 , 两 种 类 型 之 间 结 构 等 价 (structurally equivalent) 当 且 仅 当 下 
面 的 某 个 条 件 为 真 : 

。 它们 是 相同 的 基本 类 型 。 

。 它们 是 将 相同 的 类 型 构造 算 子 应 用 于 结构 等 价 的 类 型 而 构造 得 到 。 

。 一 个 类 型 是 男 一 个 类 型 表达 式 的 名 字 。 

如 果 类 型 名 仅仅 代表 它 自身 , 那么 上 述 定义 中 的 前 两 个 条 件 定义 了 类 型 表达 式 的 名 等 价 
(name equivalence) 关系 。 

如 果 我 们 使 用 算法 6.3, 那么 名 等 价 表达 式 将 被 赋予 相同 的 值 编码 。 结 构 等 价 关 系 可 以 使 用 
6. 5. 5 节 中 给 出 的 合 一 算法 进行 检验 。 
6.3.3 声明 

我 们 在 研究 类 型 及 其 声明 时 将 使 用 一 个 经 过 简化 的 文法 , 在 这 个 文法 中 一 次 只 声明 一 个 名 
字 。 一 次 声明 多 个 名 字 的 情况 可 以 像 例 5. 10 中 讨论 的 那样 进行 处 理 。 我 们 使 用 的 文法 如 下 : 

D s Tia: D| 

T > BC | record '{ D'Y 


B — int | float 
Co les! [num 


上 述 处 理 基 本 类 型 和 数组 类 型 的 文法 ,可 以 用 来 演示 5. 3. 2 节 中 描述 的 继承 属性 。 本 节 的 不 同 之 
处 在 于 我 们 不 仅 考 虑 类 型 本 身 , 还 考虑 各 个 类 型 的 存储 布局 。 

非 终结 符号 D 生成 一 系列 声明 。 非 终结 符号 7 生成 基本 类 型 、 数 组 类 型 或 记录 类 型 。 非 终 
结 符 号 8 生成 基本 类 型 int 和 float 之 一 。 非 终结 符号 CRR DE) 产生 零 个 或 多 个 整数 ， 
每 个 整数 用 方 括号 括 起 来 。 一 个 数组 类 型 包含 一 个 由 B 指定 的 基本 类 型 , 后 面 跟 一 个 由 非 终 绪 
符号 C 指定 的 数组 分 量 。 一 个 记录 类 型 (7 的 第 二 个 产生 式 ) 由 各 个 记录 字段 的 声明 序列 构成 ， 
并 被 花 插 号 括 起 来 。 
6. 3.4 局 部 变量 名 的 存储 布局 

从 变量 类 型 我 们 可 以 知道 该 变量 在 运行 时 刻 需要 的 内 存 数 量 。 在 编译 时 刻 , 我们 可 以 使 用 
这 些 数量 为 每 个 名 字 分 配 一 个 相对 地 址 。 名 字 的 类 型 和 相对 地 址 信息 保存 在 相应 的 符号 表 条 目 
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中 。 对 于 字符 串 这 样 的 变 长 数据 ,以 及 动态 数组 这 样 的 只 有 在 运行 时 刻 才能 够 确定 其 大 小 的 数 
据 , 处 理 的 方法 是 为 指向 这 些 数据 的 指针 保留 一 个 已 知 的 固定 大 小 的 存储 区 域 。 运 行 时 刻 的 存 
储 管理 问题 将 在 第 7 章 中 讨论 。 





地 址 对 齐 | 
数据 对 象 的 存储 布局 受 目标 机 器 的 寻 址 约束 的 影响 。 比 如 , 将 整数 相 加 的 指令 往往 希望 
整数 能 够 对 齐 (aligned) , 也 就 是 说 ,希望 它们 被 放 在 内 存 中 的 特定 位 置 上 ,比如 地 址 能 够 被 4 
整除 的 位 置 上 。 虽 然 一 个 有 10 个 字符 的 数组 只 需要 足以 存放 10 个 字符 的 字 节 空间 , 但 编译 
器 常常 会 给 它 分 配 12 个 字 节 , 即 下 一 个 4 的 倍数 , 这 样 会 有 2 个 字 节 没有 使 用 。 因 为 对 齐 的 
要 求 而 分 配 的 无 用 空间 被 称 为 “ 补 白 ”( padding) 。 当 空间 比较 宝贵 时 , 编译 器 需要 对 数据 进 
行 压缩 (pack), 此 时 不 存在 “ 补 白 ” 空 间 , 但 可 能 需要 在 运行 时 刻 执行 额外 的 指令 把 被 压缩 的 
数据 重新 定位 ,以 便 这 些 数据 看 上 去 仍然 是 对 齐 的 ， 从 而 进行 相关 运算 。 


假设 存储 区 域 是 连续 的 字 节 块 , 其 中 字 节 是 可 寻 址 的 最 小 内 存单 位 。 一 个 字 节 通常 有 8 个 二 
进 制 位 , 若干 字 节 组 成 一 个 机 器 字 。 多 字 节 数据 对 象 往往 被 存储 在 一 段 连续 的 字 节 中 , 并 以 初始 
字 节 的 地 址 作为 该 数据 对 象 的 地 址 。 

类 型 的 宽度 (width) 是 指 该 类 型 的 一 个 对 象 所 需 的 存储 单元 的 数量 。 一 个 基本 类 型 ， 比 如 字 
符 型 、 整 型 和 浮 点 型 , 需要 整数 多 个 的 字 节 。 为 方便 访问 , 为 数组 和 类 这 样 的 组 合 类 型 数据 分 配 
的 内 存 是 一 个 连续 的 存储 字 节 块 9。 

图 6-15 中 给 出 的 翻译 方案 (SDT) 计算 了 基本 类 型 和 数组 类 型 以 及 它们 的 宽度 。 记 录 类 型 将 
在 6. 3.6 节 中 讨论 。 这 个 SDT 为 每 个 非 终 结 符号 使 用 综合 属性 type 和 widih。 它 还 使 用 了 两 个 变 
Ht Al w, 变量 的 用 途 是 将 类 型 和 宽度 信息 从 语法 分 析 树 中 的 B 结 点 传递 到 对 应 于 产生 式 Ce 
的 结 点 。 在 语法 制导 定义 中 , ;和 将 是 C 的 继承 属性 。 


{ t = B.type; w = B.width; } 

{ T, type =C.type; T. width =C. width } 

{ B.type = integer; B.width = 4; } 
float { B.type = float; B.width = 8; } 








€ { C.type = t; C.width = w; } 


[ num ] CI { C.type = array(num.value, C1.type); 
C.width = num.value x C, .width; } 


图 6-15 计算 类 型 及 其 宽度 


T 产 生 式 的 产生 式 体 包含 一 个 非 终结 符号 B、 一 个 动作 和 一 个 非 终 结 符号 C, 其 中 C 显示 在 
FITE, BAC 之 间 的 动作 是 将 i 设置 为 B.type, 并 将 w WEN B. widths WR Bint, 则 
B. type WEH integer, B. width 被 设置 为 4, 即 一 个 整 型 数 的 宽度 。 类 似 的 , 如果 B—float, W 
B. type 和 B. width 分 别 被 设置 为 float 和 8, 即 宽度 为 一 个 浮 点 数 的 宽度 。 

C 的 产生 式 决 定 了 了 7 了 生成 的 是 一 个 基本 类 型 还 是 一 个 数组 类 型 。 如 果 Ce, Mt EM 
C. type, H w ÆW C. width, 

否则 ，C 就 描述 了 一 个 数组 分 量 。C 一 [num] C1 的 动作 将 类 型 构造 算 子 aray 应 用 于 运算 分 量 
num. value 和 C1. type, 构造 得 到 C. type. PAN, 应 用 array 的 结果 可 能 是 图 6-14 所 示 的 树 形 结构 。 








O 在 C 或 C++ 中 , 如 果 所 有 的 指针 具有 相同 的 宽度 , 那么 指针 的 存储 分 配 就 比较 简单 。 其 原因 是 我 们 可 以 在 知道 
它 所 指向 对 象 的 类 型 之 前 就 为 它 分 配 存储 空间 。 
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数组 的 宽度 是 将 数组 元 素 的 个 数 乘 以 单个 数组 元 素 的 宽度 而 得 到 的 s 如 果 连 续 存放 的 整数 
的 地 址 之 间 的 差距 为 4， 那么 一 个 整数 数组 的 地 址 计算 将 包含 乘 4 运算 。 这 样 的 乘法 运算 为 优化 
提供 了 机 会 ,因此 让 前 端 程序 在 其 输出 中 明确 描述 这 些 运算 将 有 助 于 优化 。 在 这 一 章 中 ， 我们 将 
忽略 其 他 与 机 器 相关 特性 ,比如 数据 对 象 的 地 址 必须 和 机 器 字 的 边界 对 齐 。 
加 一 关 型 inaef2 ] [3 ] 的 语法 分 析 树 用 图 6-16 中 的 虚线 描述 。 图 中 的 实 线 描述 了 wpe 和 
width 是 如 何 从 B 结 点 开始 , 通过 变量 Mw, 沿 着 多 个 C 组 成 的 链 下 传 , 然后 又 作为 综合 属性 
type 和 width 灌 此 链 返 回 的 。 在 访问 包含 C 绪 点 的 子 树 之 前 , 变量 + 和 w 被 赋予 B type 和 B. width 
的 值 。 变 量 t 和 ww 的 值 在 Ce 对 应 的 结 点 上 使 用 , 然后 开始 沿 着 多 个 C 结 点 组 成 的 链 向 上 对 综 


合 属性 求 值 。 口 
T type = array(2, array(3, integer)) 
-.. width = 24 
ae | t= integer’ ce type = array(2, array(3, integer)) 
B type = integer w= 4 hs C a width = 24 ; 


: width = 4 | 
int [2] 









$ C type = array(3, integer) 
width = 12 


ss C type = integer 
width = 4 


€ 


图 6-16 数组 类 型 的 语法 制导 翻译 


6. 3.5 声明 的 序列 

像 C 和 Java 这 样 的 语言 支持 将 单个 过 程 中 的 所 有 声明 作为 一 个 组 进行 处 理 。 这 些 声明 可 能 
分 布 在 一 个 Java 过 程 中 , 但 是 仍然 能 够 在 分 析 该 过 程 时 处 理 它们 。 因 此 , 我 们 可 VA ti FA TE 
E, 比如 offset, 来 跟踪 下 一 个 可 用 的 相对 地 址 。 

图 6-17 中 的 翻译 方案 处 理 形 如 7 id 的 声明 的 序列 , 其 中 的 7 了 如 图 6-15 所 示 产 生 一 个 类 型 。 
在 考虑 第 一 个 声明 之 前 , offset 被 设置 为 0。 每 处 理 一 个 变量 x 时, x 被 加 入 符号 表 , 它 的 相对 地 
址 被 设置 为 offset 的 当前 值 。 随 后 , x 的 类 型 的 宽度 被 加 到 offset Eo 

产生 式 DOT id ; D; 中 的 语义 动作 首先 ey { offset = 0; } 
执行 top. put (id. lexeme, T. type, offset) ,创建 D 


一 个 符号 表 条 目 é 这 里 的 top 指向 当前 的 符号 D > Tid; { top.put(id.lexeme, T.type, offset); 
offset = offset + T.width; } 








表 。 方 法 top. put H id. lexeme 创建 一 个 符号 表 Di 
ZA, 该 条 目的 数据 区 中 存放 了 类 型 Ttype |P S 
和 相对 地 址 offset o 图 6-17 计算 被 声明 变量 的 相对 地 址 
如 果 我 们 把 第 一 个 产生 式 写 在 同一 行 中 : 
P—+| offset =0; | D (6.1) 


则 图 6-17 中 对 offset 的 初始 化 处 理 就 变 得 更 容易 理解 。 生 成 e 的 非 终结 符号 称 为 标记 非 终结 符 
号 , 其 作用 是 重 写 产生 式 , 使 得 所 有 的 语义 动作 都 出 现在 产生 式 右 部 的 尾 端 , 具体 方法 见 5. 5.4 
节 。 使 用 标记 非 终 结 符号 M, (6.1) TURKS: 

P— M D 

M—e | offset =0; } 
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6.3.6 ”记录 和 类 中 的 字段 

图 6-17 中 对 声明 的 翻译 方案 还 可 以 用 于 处 理 记录 和 类 中 的 字段 。 要 把 记录 类 型 加 入 到 图 
6-15 所 示 的 文法 中 , 只 需要 加 上 下 面 的 产生 式 : 

T— record '{ 'D'}’ 

这 个 记录 类 型 中 的 字段 由 D 生成 的 声明 序列 描述 。 图 6-17 中 的 方法 可 以 用 来 确定 这 些 字段 的 类 
型 和 相对 地 址 ,当然 我 们 需要 小 心地 处 理 下 面 两 件 事 : 

。 一 个 记录 中 各 个 字段 的 名 字 必须 是 互 不 相同 的 。 也 就 是 说 , EHD 生成 的 声明 中 , 同一 个 

名 字 最 多 出 现 一 次 。 

。 字 段 名 的 偏 移 量 , 或 者 说 相对 地 址 , 是 相对 于 该 记录 的 数据 区 字段 而 言 的 。 
ER 在 一 个 记录 中 , 把 名 字 * 用 作 字 段 名 并 不 会 和 记录 外 对 该 名 字 的 其 他 使 用 产生 冲突 。 
因此 下 列 声明 中 对 * 的 三 次 使 用 是 不 同 的 , 互相 之 间 并 不 冲突 。 


float x; 
record { float x; float y; } p; 
record { int tag; float x; float y; } q; 


这 些 声明 之 后 的 一 个 赋值 语句 x =p. x + q. x; 把 变量 x 的 值 设置 为 记录 p 和 a 中 x 字 段 的 值 的 
和 。 请 注意 , p 中 x 的 相对 地 址 和 a 中 x 的 相对 地 址 是 不 同 的 。 回 

为 方便 起 见 , 记录 类 型 将 使 用 一 个 专用 的 符号 表 , 对 它们 的 各 个 字段 的 类 型 和 相对 地 址 进行 
编码 。 记 录 类 型 形 如 record(t) , 其 中 record 是 类 型 构造 算 子 , t 是 一 个 符号 表 对 象 , 它 保存 了 有 关 
该 记录 类 型 的 各 个 字段 的 信息 。 

图 6-18 中 的 翻译 方案 包含 一 个 产生 式 , 该 产生 式 将 加 入 到 图 6-15 中 关于 了 的 产生 式 中 。 这 
个 产生 式 有 两 个 语义 动作 。 在 D 之 前 媒 入 的 动作 首先 保存 top 指向 的 已 有 符号 表 , 然后 让 top 指 
向 新 的 符号 表 。 该 动作 还 保存 了 当前 offset (EL, 并 将 offset 重 置 为 0。D 生成 的 声明 会 使 类 型 和 相 
对 地 址 被 保存 到 新 的 符号 表 中 。D 之 后 的 语义 动作 使 用 top 创建 一 个 记录 类 型 , 然后 恢复 早先 保 
存 好 的 符号 表 和 偏 移 值 。 





T + record'{' { Env.push(top); top = new Env(); 
Stack.push( offset); offset = 0; } 


pity { T.type = record(top); T.width = offset; 
top = Env.pop(); offset = Stack.pop(); } 





图 6-18 处理 记录 中 的 字段 名 


为 了 使 翻译 方案 更 加 具体 ,图 6-18 中 的 动作 给 出 了 某 个 实现 的 伪 代 码 。 令 Ew 类 实现 符号 
表 。 对 Env. push( top) 的 调用 将 top 所 指 的 当前 符号 表 压 人 一 个 栈 中 。 然 后 , 变量 top 被 设置 为 指 
向 一 个 新 的 符号 表 。 类 似 的 , offset 被 推 人 名 为 Stack MRE, offset 变量 被 重 置 为 0。 

在 DD 中 的 声明 被 翻译 之 后 , 符号 表 top 保存 了 这 个 记录 中 所 有 字段 的 类 型 和 相对 地 址 。 而 
E, offset 还 给 出 了 存放 所 有 字段 所 需 的 存储 空间 。 第 二 个 动作 将 T. type 设 为 record(top), 并 将 
T. width KH offset, RIG, 变量 top 和 offset 将 被 恢复 为 原先 被 压 和 人 栈 中 的 值 ， 以 完成 这 个 记录 类 
型 的 翻译 。 

有 关 记 录 类 型 存储 方式 的 讨论 还 可 以 被 推广 到 类 , 因为 我 们 无 需 为 类 中 的 方法 保留 存储 空 
间 。 见 练习 6. 3. 2。 
6.3.7 6.3 节 的 练习 

练习 6. 3. 1: 确定 下 列 声 明 序列 中 各 个 标识 符 的 类 型 和 相对 地 址 。 
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float x; 
record { float x; float y; } p; 
record { int tag; float x; float y; Figs 


| 练习 6. 3.2: 将 图 6-18 对 字段 名 的 处 理 方法 扩展 到 类 和 单 继承 的 类 层次 结构 。 

1) 给 出 类 Env 的 一 个 实现 。 该 实现 支持 符号 表 链 ， 使 得 子 类 可 以 重 定义 一 个 字段 名 , 也 可 
以 直接 引用 某 个 超 类 中 的 字段 名 。 

2) 给 出 一 个 翻译 方案 ， 该 方案 能 够 为 类 中 的 字段 分 配 连 续 的 数据 区 域 ， 这 些 字段 中 包含 继 
承 而 来 的 域 。 继承 而 来 的 字段 必须 保持 在 对 超 类 进行 存储 分 配 时 获得 的 相对 地 址 。 


6.4 表达 式 的 翻译 


未 章 剩 下 的 部 分 将 介绍 在 翻译 表达 式 和 语句 时 出 现 的 问题 。 在 本 节 中 ， 我 们 首先 考虑 从 表 
达 式 到 三 地 址 代码 的 翻译 。 一 个 带 有 多 个 运算 符 的 表达 式 ( 比如 4。+b* c) 将 被 翻译 成 为 每 条 指 
令 最 多 包含 一 个 运算 符 的 指令 序列 。 一 个 数组 引用 4[i] [站 将 被 扩展 成 一 个 计算 该 引用 的 地 址 的 
三 地 址 指令 序列 。 我 们 将 在 6.5 节 中 考虑 表达 式 的 类 型 检查 , 并 在 6. 6 节 中 介绍 如 何 使 用 布尔 表 
达 式 来 处 理 程序 的 控制 流 。 
6.4.1 ”表达 式 中 的 运算 

图 6-19 中 的 语法 制导 定义 使 用 5 的 属性 code 以 及 表达 式 的 属性 addr 和 code, 为 一 个 赋值 
语句 5 生成 三 地 址 代码 。 属 性 S. code 和 E. code 分 别 表示 S 和 瑟 对 应 的 三 地 址 代码 。 属性 E. addr 
则 表示 存放 的 值 的 地 址 。 回 忆 一 下 6. 2. 1 节 , 一 个 地 址 可 以 是 变量 名 字 、 常量 或 编译 器 产生 的 
临时 量 。 





语义 规则 
S + id=E; | S.code=:B.code|| 


gen(top.get(id.lereme) 三 E.addr) 





E + E, +E | E.addr = new Temp() 
E.code = Ey.code || E2.code || 
gen(B.addr'=' Ei.addr '+' E.addr) 


| By E.addr = new Temp () 
E.code = Ei.code || 
gen(E.addr'=''minus’ Ei.addr) 





| (Ey) E.addr = Ei.addr 
E.code = Bi.code 








| id E.addr = top.get(id.lexeme) 
E.code ='' 


图 6-19 ”表达 式 的 三 地 址 代码 


考虑 图 6-19 中 语法 制导 定义 的 最 后 一 个 产生 式 Eid, 若 表达 式 只 是 一 个 标识 符 ， 比 如 说 
x, 那么 x 本 身 就 保存 了 这 个 表达 式 的 值 。 这 个 产生 式 对 应 的 语义 规则 把 E. addr 定义 为 指向 该 id 
的 实例 对 应 的 符号 表 条 目的 指针 。 令 top 表示 当前 的 符号 表 。 当 函数 top. get 被 应 用 于 id 的 这 个 
实例 的 字符 串 表 示 id. lexeme IY, 它 返 回 对 应 的 符号 表 条 目 。E. code 被 设置 为 空 串 。 

当 规则 为 (El) 时 , 对 的 翻译 与 对 子 表达 式 E 的 翻译 相同 。 因 此 , E. addr FT 
E,. addr, E. code 等 于 Ei. code. 

图 6-19 中 的 运算 符 + 和 单 目 - RWS PAAR. EE, +E, 的 语义 规则 生成 
了 根据 E, ALE, 的 值 计算 五 的 值 的 代码 。 计算 得 到 的 值 存放 在 新 生成 的 临时 变量 中 。 如 果 Ei 的 
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值 计算 后 被 放 和 E,. addr, E, 的 值 被 放 到 E,. addr tH, 那么 E, + E, 就 可 以 被 翻译 为 =. addr + 
Ez. addr, 其 中 i 是 一 个 新 的 临时 变量 。E. addr WA to 连续 执行 new Temp( ) 会 产生 一 系列 互 
不 相同 的 临时 变量 4 殊 

为 方便 起 见 , 我 们 使 用 记号 gen(x =' y! +  z) 来 表示 三 地 址 指令 w=y+zsi 当 被 传递 给 gen 
时 , 变量 x、y、z 的 位 置 上 出 现 的 表达 式 将 首先 被 求 值 , 而 像 ' = ' 这 样 的 引号 内 的 字符 串 则 按照 字 
面值 传递 9。 其 他 的 三 地 址 指令 的 生成 方法 类 似 , 也 是 将 gen 作用 于 表达 式 和 字符 串 的 组 合 。 

当 我 们 翻译 产生 式 EE, + Ez 时; 图 6-19 中 的 语义 规则 首先 将 1. code 和 Ey. code 连接 起 
K, 然后 再 加 上 一 条 将 El AE, 的 值 相 加 的 指令 , 从 而 生成 E. code, 新 增加 的 这 条 指令 将 求 和 的 
结果 放 和 一 个 为 五 生 成 的 临时 变量 中 , 用 E. addr 表示 。 

产生 式 E— —E, 的 翻译 过 程 与 此 类 似 。 这 个 规则 首先 为 刀 创建 一 个 新 的 临时 变量 , 并 生成 
一 条 指令 来 执行 单 目 -运算 。 

RA, 产生 式 Sid =E; 所 生成 的 指令 将 表达 式 E 的 值 赋 给 标识 符 这 。 和 规则 已 ,id 中 一 
样 ,这 个 产生 式 的 语义 规则 使 用 函数 top. get 来 确定 id 所 代表 的 标识 符 的 地 址 。5S. code 包含 的 指 
令 首 先 计算 的 值 并 将 其 保存 到 由 E. addr 指定 的 地 址 中 ， 然后 再 将 这 个 值 赋 给 这 个 id 实例 的 地 
Uk top. get( id. lexeme) 。 
图 6-19 中 的 语法 制导 定义 将 赋值 语句 a =b + - c; 翻译 成 如 下 的 三 地 址 代码 序列 ， 

tı = minus c 


t3 = b + ty 
a= to 


m 
6.4.2 增 量 翻译 

code 属性 可 能 是 很 长 的 字符 串 , 因此 就 像 5. 5. 2 节 中 讨论 的 那样 ， 它们 通常 是 用 增 量 的 方 
式 生成 的 。 因 此 , 我 们 不 会 像 图 6-19 所 示 的 那样 构造 E. code, 我 们 可 以 设法 像 图 6-20 中 那样 只 
生成 新 的 三 地 址 指令 。 在 这 个 增 量 方式 中 ,gen 不 仅 要 构造 出 一 个 新 的 三 地 址 指令 , 还 要 将 它 添 
加 到 至 今 为 止 已 生成 的 指令 序列 之 后 。 指令 序列 可 以 暂时 放 在 内 存 中 以 便 进一步 处 理 , 也 可 以 
增 量 地 输出 。 

图 6-20 中 的 翻译 方案 和 图 6-19 中 的 
语法 制导 定义 产生 相同 的 代码 。 采 用 增 
量 方式 时 不 需 再 用 到 code 属性 ,因为 对 
gen 的 连续 调用 将 生成 一 个 指令 序列 。 
例如 ， 6-20 中 对 应 于 EE, +E, 的 语 
义 规则 直接 调用 gen 产生 一 条 加 法 指令 。 
在 此 之 前 , 翻译 方案 已 经 生成 了 计算 E 
的 值 并 放 入 Ei. addr、 计 算 E, 的 值 并 放 ， 
A, E,. addr 的 指令 序列 。 

图 6-20 的 方法 也 可 以 用 来 构造 语法 E 6-20 ” 增 量 生 成 表达 式 的 三 地 址 代码 
树 , 对 应 于 EE, +E, 的 语义 动作 使 用 构造 算 子 生成 新 的 结 点 。 规 则 如 下 ， 

E—>E, + E, | E. addr = new Node( + ', E,. addr, E,. addr) ; | 
RE, 属性 addr 表示 的 是 一 个 结 点 的 地 址 ， 而 不 是 某 个 变量 或 常量 。 








Si id= E; 





{ gen( top.get(id.leveme) '=' E.addr); } 





E > E+E, { E.addr = new Temp (); 
gen(E.addr'=' E, .addr '+' Ez.addr); } 






bo Py { E.addr = new Temp (); 
gen(E.addr '=' 'minus' E; .addr); } 






| € Be) { E.addr = E,.addr; } 





| id { E.addr = top.get(id.lezeme); } 








O 在 语法 制导 定义 中 ,gen 构造 出 一 条 指令 并 返回 它 。 在 翻译 方案 中 ， gen 构造 出 一 条 指令 , 并 增 量 地 将 它 添加 到 指 
令 流 中 去 。 
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6.4.3 ”数组 元 素 的 寻 址 

将 数组 元 素 存 储 在 一 块 连续 的 存储 空间 里 就 可 以 快速 地 访问 它们 。 在 C 和 Java H, 一 个 具 
有 并 个 元 素 的 数组 中 的 元 素 是 按照 0, 1,…, n -1 编号 的 。 假 设 每 个 数组 元 素 的 宽度 是 w, 那么 
数组 4 的 第 i 个 元 素 的 开始 地 址 为 

base +i x w (6.2) 
其 中 base 是 分 配给 数组 4 的 内 存 块 的 相对 地 址 。 也 就 是 说 , base 是 4[0] 的 相对 地 址 。 

式 (6.2) 可 以 被 推广 到 C 语言 中 的 二 维 或 多 维 数组 上 。 对 于 二 维 数组 , 我们 在 C 中 用 
ALi, | [is] 来 表示 第 TTA in 个 元 素 。 假设 一 行 的 宽度 是 wi, 同一 行 中 每 个 元 素 的 宽度 是 wo 
A[ 记 [i 记 ] 的 相对 地 址 可 以 使 用 下 面 的 公式 计算 

base +i, Xw; tig XW (6-3) 
XIF k AERA, HAARA 
base +i; Xw; tip Xw, + +i, XW, (6.4) 
其 中 , wj(1<j<%k) 是 对 式 (6.3) 中 的 wi Al w 的 推广 。 

男 一 种 计算 数组 引用 的 相对 地 址 的 方法 是 根据 第 j 维 上 的 数组 元 素 的 个 数 n 和 该 数组 的 每 

个 元 素 的 宽度 w=w; 进行 计算 。 在 二 维 数组 中 ( 即 =2, w=w,), ALi, ] Lin | HEA 


base + (i; Xn +i,) Xw (6.5) 
对 于 大 维 数组 ,下列 公式 计算 得 到 的 地 址 和 公式 (6.4) 所 得 到 的 地 址 相同 : 
base + ((+++( (i, Xn +i,) Xz +13) °*+) Xn, +i,) Xw (6. 6) 


在 更 一 般 的 情况 下 , 数组 元 素 下 标 并 不 一 定 是 从 0 开始 的 。 在 一 个 一 维 数组 中 , 数组 元 素 的 编号 方 
式 如 下 : low, low +1,…,high, 而 base 是 AL low] 的 相对 地 址 。 计 算 4[ 让 的 地 址 的 式 (6.2) 就 变 成 : 
base + (i—low) xw (6-7) 

式 (6.2) 和 式 (6.7) 都 可 以 改写 成 ixw +c 的 形式 , 其 中 的 子 表达 式 c= base - low xw 可 以 在 
编译 时 刻 预先 计算 出 来 。 请 注意 ; 当 low 为 0 时 c=base。 我 们 假定 c 被 存放 在 4 对 应 的 符号 表 条 
BP, 那么 只 要 把 ixw 加 到 < 上 就 可 以 计算 得 到 A[ 引 的 相对 地 址 。 

编译 时 刻 的 预先 计算 同样 可 以 应 用 于 多 维 数组 元 素 的 地 址 计算 , 见 练习 6.4.5, Ri, 有 一 
种 情况 下 我 们 不 能 使 用 编译 时 刻 预 先 计算 的 技术 : 当 数 组 大 小 是 动态 变化 的 时 候 。 如 果 我 们 在 
编译 时 刻 无 法 知道 low 和 high( 或 者 它们 在 多 维 数组 情况 下 的 泛 化 ) 的 值 , 我 们 就 无 法 提前 计算 出 
像 “这样 的 常量 。 因 此 在 程序 运行 时 , 像 (6.7) 这 样 的 公式 就 需要 按照 公式 所 写 进行 求 值 。 

上 面 的 地 址 计算 是 基于 数组 的 按 行 存放 方式 的 , C 语言 都 使 用 这 种 数据 布局 方式 。 一 个 二 维 
数组 通常 有 两 种 存储 方式 ,， 即 按 行 存放 (一 行 行 地 存放 ) 和 按 列 存放 (一 列 列 地 存放 ) 。 图 6-21 显 
示 了 一 个 2 x3 的 数组 4 的 两 种 存储 布局 方式 , 图 6-21a 中 是 按 行 存放 方式 , 图 6-21b 中 是 按 列 存 
放 方 式 。Fortran 系列 语言 使 用 按 列 存放 方式 。 





ahh fa 
第 一 行 中 
+ 第 二 列 
chy + 
第 三 列 
we 

a) 按 行 存放 b) 按 列 存放 


图 6-21 二 维 数组 的 存储 布局 
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我 们 可 以 把 按 行 存放 策略 和 按 列 存放 策略 推广 到 多 维 数组 中 。 按 行 存放 方式 的 推广 形式 按 
照 如 下 方式 来 存储 元 素 ; 当 我 们 扫描 一 块 存储 区 域 时 ， 就 像 汽 车 里 程 表 中 的 数字 一 样 ， 最 右边 的 
下 标 变化 最 为 频繁 。 而 按 列 存放 方式 则 被 推广 为 相反 的 布局 方式 ,最 左边 的 下 标 变化 最 频繁 
6. 4.4 数组 引用 的 翻译 

为 数组 引用 生成 代码 时 要 解决 的 主要 问题 是 将 6. 4. 3 节 中 给 出 的 地 址 计算 公式 和 数组 引用 
的 文法 关联 起 来 。 令 非 终 结 符号 工 生 成 一 个 数组 名 字 再 加 上 一 个 下 标 表达 式 的 序列 : 

L- LIET) id [E] 

与 C 和 Java 中 一 样 , 我 们 假定 数组 元 素 的 最 小 编号 是 0。 我 们 使 用 式 (6.4) , 基于 宽度 来 计 
算 相对 地 址 ,而 不 是 像 式 (6. 6) 中 那样 使 用 元 素 的 数量 来 计算 地 址 。 图 6-22 所 示 的 翻译 方案 为 带 
有 数组 引用 的 表达 式 生成 三 地 址 代码 。 它 包括 了 图 6-20 中 给 出 的 产生 式 和 语义 动作 , 同时 还 包 
括 了 涉及 非 终结 符号 工 的 产生 式 。 





ls + id=E; { gen( top.get(id.leveme) '=' E.addr); } 
| L=E;  { gen(L.array .base'[! L.addr ']' '=' E.addr); } 


E> E+E, { E.addr = new Temp(); 
gen(E.addr'=' E,.addr'+' E2.addr); } 


| id { E.addr = top.get(id.lexeme); } 


KSE { E.addr = new Temp (); 
gen(E.addr '=' L.array.base '|' L.addr ')'); } 





L > id [E] { L.array = top.get(id-lexeme); 
L.type = L.array.type.elem; 
L.addr = new Temp (); 
gen(L.addr ‘=' E.addr'' L.type.width); } 


| Li CE) {Loamy = Ly. array; 
L.type = Ly.type.elem; 
t= new Temp(); 
L.addr = new Temp (); 


gen(t '=' B.addr'«' L.type.width); 
gen(L.addr '=' Li.addr '+' t); } 





图 6-22 ”处理 数组 引用 的 语义 动作 


非 终结 符号 上 有 三 个 综合 属性 : 

1) L. addr 指示 一 个 临时 变量 。 这 个 临时 变量 将 被 用 于 累加 公式 (6.4) 中 的 六 x 邮 项 ,从 而 
计算 数组 引用 的 偏 移 量 。 

2) L. array 是 一 个 指向 数组 名 字 对 应 的 符号 表 条 目的 指针 。 在 分 析 了 所 有 的 下 标 表达 式 之 
后 , 该 数组 的 基地 址 ,也 就 是 二 . array. base, 被 用 于 确定 一 个 数组 引用 的 实际 左 值 。 

3) L. type 是 工 生 成 的 子 数组 的 类 型 。 对 于 任何 类 型 t+, 我 们 假定 其 宽度 由 上 width 给 出 。 我 
们 把 类 型 (而 不 是 宽度 ) 作 为 属性 ; 是 因为 无 论 如 何 类 型 检查 总 是 需要 这 个 类 型 信息 。 对 于 任何 
数组 类 型 t, 假设 上 elem 给 出 了 其 数组 元 素 的 类 型 。 

产生 式 Sid =E; 代表 一 个 对 非 数 组 变量 的 赋值 语句 ， 它 按照 通常 的 方法 进行 处 理 。 
SL=E; 的 语义 动作 产生 了 一 个 带 下 标的 复制 指令 , 它 将 表达 式 记 的 值 存放 到 数组 引用 上 所 指 
的 内 存 位 置 。 回 顾 一 下 , AHE L. array 给 出 了 数组 的 符号 表 条 目 。 数 组 的 基地 址 ( 即 0 号 元 素 的 
地 址 ) H L. array. base 给 出 。 属 性 L. addr 表示 一 个 临时 变量 , 它 保 存 了 工 生成 的 数组 引用 的 偏 移 
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Bk, AUG, 这 个 数组 引用 的 位 置 是 二 array. basel L. addr] 。 这 个 指令 将 地 址 已 addr 中 的 右 值 放 入 
区 的 内 存 位 置 中 。 

产生 式 EE, + E, Al Eid 与 以 前 相同 。 新 的 产生 式 ESL 的 语义 动作 生成 的 代码 将 上 所 指 
位 置 上 的 值 复 制 到 一 个 新 的 临时 变量 中 。 和 前 面 对 产 生 式 SoOL=E; 的 讨论 一 样 , 上 所 指 的 地 址 
BE L. array. base[ L. addr], 其 中 , Jatt L. array 仍然 给 出 了 数组 名 ,上 . array. base 给 出 了 数组 的 
基地 址 。 属 性 L. addr 表示 保存 偏 移 量 的 临时 变量 。 数组 引用 的 代码 将 存放 在 由 基地 址 和 偏 移 量 
给 出 的 位 置 中 的 右 值 放 入 .addr 所 指 的 临时 变量 中 。 
ire Sa 表示 一 个 2 x3 的 整数 数组 , c、i、j 都 是 整数 。 那 么 a 的 类 型 就 是 aray (2， 
array(3 ,integer) ) 。 假 定 一 个 整数 的 宽度 为 4, 那么 a 的 类 型 的 宽度 就 是 24。a[ i] 的 类 型 是 ar- 
ray(3 , integer) , 宽度 wi 为 12。 a[ i][j] 的 类 型 是 整 型 。 

图 6-23 给 出 了 表达 式 c +a[ i][j] 的 注释 语法 分 析 树 。 该 表达 式 被 翻译 成 图 6-24 中 给 出 的 


三 地 址 代码 序列 。 这 里 我 们 仍然 使 用 每 个 标识 符 的 名 字 来 表示 它们 的 符号 表 条 目 。 O 
saat = ts 
| 
er =c 3 E.addr = ta 
c iam =a 
L.type = integer 
L.addr = t3 


L.array =a 
L.type = array(3, integer) [ E.addr = j ] 
L.addr = tı 





| 
a type [ dan = ] 
= array(2, array(3, integer)) : send) pa E a J5 
图 623 c+a[i][j] 的 注释 语法 分 析 树 的 三 地 址 代码 


6.4.5 “6.4 节 的 练习 
练习 6. 4.1: 向 图 6-19 的 翻译 方案 中 加 入 对 应 于 下 列 产 生 式 的 规则 : 
1) E-E, * Ez 
2) E->+Ei( 单 目 加 ) 
练习 6.4.2: 使 用 图 6.20 中 的 增 量 式 翻译 方案 重复 练习 6.4. 1。 
练习 6. 4 3: 使 用 图 6-22 所 示 的 翻译 方案 来 翻译 下 列 赋 值 语句 : 
1) x = ali] tb 
2) x = ali] [j] + bil tj] 
13) x = alb[i][j]] [c[k]] 
| 练习 6. 4.4: 修改 图 6-22 中 的 翻译 方案 , 使 之 适合 Fortran 风格 的 数组 引用 ,也 就 是 说 ,nn 
维 数 组 的 引用 为 id[ Ei oh Eroll 
练习 6. 4:5: 将 公式 (6.7) 推 广 到 多 维 数组 上 , 并 指出 哪些 值 可 以 被 存放 到 符号 表 中 并 用 来 
计算 偏 移 量 。 考 虑 下 列 情况 : 
1) 一 个 二 维 数组 A, 按 行 存放 8 第 一 维 的 下 标 从 l A hi, 第 二 维 的 下 标 从 氏 到 hs。 单个 数 
组 元 素 的 宽度 为 w。 
2) 其 他 条 件 和 1 相同 ; 但 是 采用 按 列 存放 方式 。 
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13) 一 个 天 维 的 数组 4， 按 行 存 放 , 元 素 宽度 为 w, 第 j 维 的 下 标 从 4 到 及 。 

! 4) 其 他 条 件 和 3 相同 , 但 是 采用 按 列 存放 方式 。 

练习 6. 4. 6: 一 个 按 行 存放 的 整数 数组 ALi, 放 的 下 标的 范围 为 1 ~10, 下 标 7 的 范围 为 1 ~ 
20。 每 个 整数 占 4 个 字 节 。 假设 数组 4 从 0 字 节 开始 存放 , 请 给 出 下 列 元 素 的 位 置 : 

IY ALES SD) APO) 8]? "3° ALS, AT] 

练习 6.4.7: 假定 4 是 按 列 存放 的 , 重复 练习 6.4.6。 

练习 6. 4. 8: 一 个 按 行 存放 的 实数 型 数组 4A[i, j, hj 的 下 标的 范围 为 1 ~4, 下 标 j 的 范围 为 
0 ~4, 且 下 标的 范围 为 5~10。 每 个 实数 占 8 个 字 节 。 假设 数组 4 从 0 字 节 开始 存放 。 计 算 下 
列 元 素 的 位 置 。 

1) Al3 44,5] 2) .A[1,2,7] 3) 39) 

56.4.9: 假定 4 是 按 列 存放 的 , 重复 练习 6. 4. 8。 





符号 化 表示 的 类 型 宽度 
中 间 代 码 应 该 相对 独立 于 目标 机 器 , 这样 当代 码 生 成 器 被 蔡 换 为 对 应 于 另 一 台 机 器 的 代 
码 生成 器 时 ,优化 器 不 需要 做 出 太 大 的 改变 。 然 而 , 正如 我 们 刚刚 描述 的 类 型 宽度 计算 方法 
所 示 , 关于 基本 类 型 的 信息 被 融合 到 了 这 个 翻译 方案 中 。 例 如 , 例 6. 12 中 假定 每 个 整数 数组 
的 元 素 占 4 个 字 节 。 一 些 中间 代 码 ， 如 Pascal 的 P-code, 让 代码 生成 器 来 填写 数组 元 素 的 大 
AN, 因此 中 间 代 码 独立 于 机 器 的 字 长 。 只 要 用 一 个 符号 常量 来 代替 翻译 方案 中 的 (作为 整数 
| 类 型 宽度 的 )4, 我 们 就 可 以 在 我 们 的 翻译 方案 中 做 到 这 一 点 。 











6.5 类 型 检查 


为 了 进行 类 型 检查 (type checking) , 编译 器 需要 给 源 程序 的 每 一 个 组 成 部 分 赋予 二 个 类 型 表 
达 式 。 然 后 ， 编 译 器 要 确定 这 些 类 型 表达 式 是 否 满足 一 组 逻辑 规则 。 这 些 规则 称 为 源 语言 的 类 
型 系统 (type system) 。 
类 型 检查 具有 发 现 程序 中 的 错误 的 潜能 。 原 则 上 ,如果 目标 代码 在 保存 元 素 值 的 同时 保存 
了 元 素 类 型 的 信息 , 那么 任何 检查 都 可 以 动态 地 进行 。 一 个 健全 (sound) 的 类 型 系统 可 以 消除 对 
动态 类 型 错误 检查 的 需要 ,因为 它 可 以 帮助 我 们 静态 地 确定 这 些 错 误 不 会 在 目标 程序 运行 的 时 
候 发 生 。 如 果 编 译 器 可 以 保证 它 接受 的 程序 在 运行 时 刻 不 会 发 生 类 型 错误 , 那么 该 语言 的 这 个 
实现 就 被 称 为 强 类 型 的 。 
除了 用 于 编译 , 类 型 检查 的 思想 还 可 以 用 于 提高 系统 的 安全 性 ， 使 得 人 们 安全 地 导入 和 执行 
软件 模块 。Java 程序 被 编译 成 为 机 器 无 关 的 字 节 码 ， 在 字 节 码 中 包含 了 有 关 字 节 码 中 的 运算 的 详 
细 类 型 信息 。 导 入 的 代码 在 被 执行 之 前 首先 要 进行 类 型 检查 ， 以 防止 因 足 忽 造 成 的 错误 和 恶意 
攻击 。 
6.5.1 类 型 检查 规则 
类 型 检查 有 两 种 形式 : 综合 和 推导 。 类 型 综合 (type synthesis) 根据 子 表达 式 的 类 型 构造 出 表 
达 式 的 类 型 。 它 要 求 名 字 先 声明 再 使 用 。 表 达 式 Ei +E, 的 类 型 是 根据 E, ME, 的 类 型 定义 的 。 
一 个 典型 的 类 型 综合 规则 具有 如 下 形式 : 
if f/f 的 类 型 为 st 且 % 的 类 型 为 s 
then 表达 式 f(x) 的 类 型 为 t 
这 里 , f 和 x 表示 表达 式 , Mi sor 表示 从 s 到 1 的 函数 。 这 个 针对 单 参数 函数 的 规则 可 以 推广 到 带 


(6.8) 
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有 多 个 参数 的 函数 。 只 要 稍 做 修改 ， 规则 (6. 8) 就 可 以 用 于 已 + 上 ,我 们 只 需要 把 它 看 作 二 个 函 
数 应 用 add(E,, E, ) 就 可 以 了 S。 

类 型 推导 (type inference) 根据 一 个 语言 结构 的 使 用 方式 来 确定 该 结构 的 类 型 。 先 看 一 下 
6. 5.4 节 中 的 例子 , 4 null 是 一 个 测试 列表 是 否 为 空 的 函数 ， 那么 , 根据 这 个 函数 的 使 用 null( =) 
我 们 可 以 指出 x 必须 是 一 个 列表 类 型 。 列表 * 中 的 元 素 类 型 是 未 知 的 ， 我 们 所 知道 的 全 部 信息 
是 : x 是 一 个 列表 类 型 ， 其 元 素 类 型 当前 未 知 。 

代表 类 型 表达 式 的 变量 使 得 我 们 可 以 考虑 未 知 类 型 。 我 们 可 以 用 希腊 字母 @\ 有 等 作为 类 型 
表达 式 中 的 类 型 变量 。 

一 个 典型 的 类 型 推导 规则 具有 下 面 的 形式 ， 

站 f(x) 是 一 个 表达 式 ， (6.9) 
then XJR o AB, f 的 类 型 为 a8 Bx WAH a 

在 类 似 ML 这 样 的 语言 中 需要 进行 类 型 推导 。ML 语言 会 检查 类 型 ， 但 是 不 需要 对 名 字 进 行 
声明 。 

在 本 节 中 ， 我 们 考虑 表达 式 的 类 型 检查 。 检查 语句 的 规则 和 检查 表达 式 类 型 的 规则 类 似 。 
例如 , 我 们 可 以 把 条 件 语句 “if (E) S; “看 作 是 对 已 和 :8 应 用 f PRR HERA void 表示 没有 
值 的 类 型 , 那么 六 函数 将 被 应 用 在 一 个 布 尔 型 和 一 个 void 型 的 对 象 上 。 此 函数 的 结果 类 型 是 
void, 

6.5.2 类 型 转换 

考虑 类 似 于 x +i 的 表达 式 ; 其 中 x 是 浮 点 数 类 型 而 i 是 整 型 。 因为 整数 和 浮 点 数 在 计算 机 中 
有 不 同 的 表示 形式 ， 而 且 使 用 不 同 的 机 器 指令 来 完成 整数 和 浮 点 数 运算 ， 编译 器 需要 把 + 的 某 
个 运算 分 量 进行 转换 ， 以 保证 在 进行 加 法 运算 时 两 个 运算 分 量具 有 相 同 的 类 型 

假定 在 必要 的 时 候 可 以 使 用 一 个 单 目 运 算 符 ( float ) 将 整数 转换 成 浮 点 数 。 例如 ,整数 2 
在 表达 式 2 *3.14 对 应 的 代码 中 被 转换 成 浮 点 数 ， 


ti = (float) 2 
to = t, * 3.14 


我 们 可 以 扩展 这 样 例子 ， 考虑 运算 符 的 整 型 和 浮 点 型 版 未 。 Kt, int * 表示 作用 于 整 型 运 
算 分 量 的 运算 符 , 而 float + 表示 作用 于 浮 点 型 运算 分 量 的 运算 符 、 

我 们 将 扩展 6. 4. 2 节 中 的 用 于 表达 式 翻 译 的 翻译 方案 ， 以 说 明 如 何 进行 类 型 综合 。 我 们 引入 
男 一 个 属性 E. type, 该 属性 的 值 可 以 是 integer & float, FI E+E, +E, 相关 的 规则 可 用 如 下 的 伪 
代码 给 出 ， 


if ( E .type = integer and Ez.type = integer ) E.type = integer; 

else if ( E; .type = float and Ez.type = integer) --. 

随 着 需要 转换 的 类 型 的 增多 ， 需要 处 理 的 不 同情 况 也 急剧 增多 。 因此 , 在 处 理 大 量 的 类 型 
时 ， 精心 组 织 用 于 类 型 转换 的 语义 动作 就 变 得 非常 重要 

个 同 语言 具有 不 同 的 类 型 转换 规则 。 图 6-25 中 的 Java 的 转换 规则 区 分 了 拓宽 (widenihg) 转 
换 和 窗 化 (narrowing) 转换 。 拓宽 转换 可 以 保持 原 有 的 信息 ， 而 窄 化 转换 则 可 能 丢失 信息 。 拓宽 
规则 通过 图 6-25a 中 的 层次 结构 给 出 . 在 该 层次 结构 中 位 于 较 低层 的 类 型 可 以 被 拓宽 为 较 高 层 的 
RA, At, char 类 型 可 以 被 拓宽 为 int WAN float Al, 但 是 不 可 以 被 拓宽 为 short 类 型 。 罕 化 转换 


一 
© 即使 我 们 在 确定 类 型 时 需要 某 些 上 下 文 信息 ， 我 们 仍 将 使 用 “综合 "这 个 术语 。 使 用 重 载 函 数 时 ( 多 个 函数 可 能 补 
赋予 同一 个 名 字 ) ， 在 某 些 语言 中 , 我 们 还 需要 考虑 E, +E, 的 上 下 文才 能 确定 其 类 型 规则 。 
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的 规则 如 图 6-25b 所 示 : 如 果 存 在 一 条 从 s 到 上 的 路 径 ， 则 可 以 将 类 型 s FENKA t 可 以 看 出 ， 
char, short, byte 之 间 可 以 两 两 相互 转换 。 cits double 
如 果 类 型 转换 由 编译 器 自动 完成 , 那么 这 样 的 | 


转换 就 称 为 隐 式 转换 。 隐 式 转换 也 称 为 自动 类 型 A Ait 
转换 (coercion) 。 在 很 多 语言 中 ,自动 类 型 转换 仅 lons lon 
仅 限 于 拓宽 转换 。 如 果 程序 员 必须 写 出 某 些 代码 l AN 


来 引发 类 型 转换 运算 , 那么 这 个 转换 就 称 为 显 式 EN, 
的 。 显 式 转换 也 称 为 强制 类 型 转换 (cast) o 
检查 ESE, +E, 的 语义 动作 使 用 了 两 个 函数 ， we 


r char ~—> short =— byte 


1) max(t,, ty) ES t, Al ty 两 个 类 型 的 参数 ， a) 拓宽 类 型 转换 b) 窄 化 类 型 转换 
并 返回 拓宽 层次 结构 中 这 两 个 类 型 中 的 最 大 者 (或 E 6-25 Java 中 简单 类 型 的 转换 


ERDER). WR t Rn 之 一 没有 出 现在 这 个 
层次 结构 中 ,比如 有 个 类 型 是 数组 类 型 或 指针 类 型 , 那么 该 函数 返回 一 个 错误 信息 。 
2) 如 果 需 要 将 类 型 为 1 的 地 址 a 中 的 内 容 转换 成 


Addr widen( Addr a, Type t, Type w) 





ww 类 型 的 值 , Wl PAK widen(a, t, w) 将 生成 类 型 转换 的 if(t=w) return a; 
ARS. UMR tA w 是 相同 的 类 型 , 则 该 函数 返回 a 本 er aa 
身 。 否 则 ， 它 会 生成 一 条 指令 来 完成 转换 工作 并 将 转 gen(temp '=" (oat) a); 
换 结果 放置 到 临时 变量 temp 中 。 这 个 临时 变量 将 作为 } ye 
结果 返回 。 函 数 widen 的 伪 代 码 如 图 6-26 Bras, 这 里 else error; 
{KX AA integer Ail float 两 种 类 型 。 
图 6-27 中 EE, + E, 的 语义 动作 说 明 了 如 何 把 图 6.26 widen 函数 的 伪 代码 


类 型 转换 加 入 到 图 6-20 所 示 的 翻译 表达 式 的 方案 中 。 

在 这 个 语义 动作 中 , 如果 El 的 类 型 不 需要 被 转换 成 五 的 类 型 , 那么 临时 变量 a, 就 是 Ey. addr. 
如 果 需 要 进行 这 样 的 转换 ,， 则 ci 就 是 widen 函数 返回 的 一 个 新 的 临时 变量 。 类 似 地 , a, 可 能 是 
Ey, addr, 也 可 能 是 一 个 新 临时 变量 ,用 于 存放 转换 后 的 5, 的 值 。 如 果 两 个 变量 都 是 整 型 或 者 都 
ERAN, 就 不 需要 进行 任何 转换 。 我 们 会 发 现 , 将 两 个 不 同类 型 的 值 相 加 的 唯一 方法 是 把 它们 
都 转换 成 为 第 三 种 类 型 。 


E = Ei +E, {E-type = mar(B.type, Bo.type); 
a, = widen(E,.addr, E,.type, E-type); 


a) = widen(Es.addr, Ez.type, E.type); 
E.addr = new Temp (); 
gen(E.addr'=' a; '+' a2); } 





图 6-27 在 表达 式 求 值 中 引入 类 型 转换 


6.5.3 函数 和 运算 符 的 重 载 

依据 符号 所 在 的 上 下 文 不 同 , 被 重 载 (overloaded ) 的 符号 会 有 不 同 的 含义 。 如 果 能 够 为 一 个 
名 字 的 每 次 出 现 确定 其 唯一 的 含义 , 该 名 字 的 重 载 问题 就 得 到 了 解决 。 在 本 节 中 , 我 们 仅 考虑 那 
些 只 需要 查看 函数 参数 就 能 解决 的 函数 重 载 。Java 中 的 重 载 即 是 如 此 。 
DAE 根据 其 运算 分 量 的 类 型 ,Java 中 的 + 运算 符 既 可 以 表示 字符 串 的 连接 运算 , 也 可 以 表 
示 加 法 运算 。 用 户 自 定义 的 函数 同样 可 以 重 载 , 例如 


void err() { a: } 
void err(String s) { -:- } 
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请 注意 , 我 们 可 以 根据 函数 err 的 参数 来 确定 选择 该 函数 的 哪 一 个 版 本 。 in 
以 下 是 针对 重 载 函数 的 类 型 综合 规则 : 
于 可 能 的 类 型 为 ,一 t;(1<i<n), HP, ss (+j) 
and x 的 类 型 为 $1(1k<n) 
then KER S(x) 的 类 型 为 
6. 1.2 节 中 的 值 编 码 方法 同样 可 以 用 于 类 型 表达 式 , 以 便 根据 参数 类 型 高 效 地 解决 重 载 问 
题 。 在 表示 类 型 表达 式 的 一 个 DAG E, 我 们 给 每 个 结 点 赋予 一 个 被 称 为 值 编码 的 整数 序号 。 使 
用 算法 6.3, 我 们 可 以 构造 出 每 个 结 点 的 范 型 , 该 范 型 由 该 结 点 的 标号 及 其 从 左 到 右 的 子 结 点 的 
值 编码 组 成 。 一 个 函数 的 范 型 由 其 函数 名 和 它 的 参数 的 类 型 组 成 。 根 据 函 数 的 参数 类 型 解决 重 
载 的 问题 就 等 价 于 基于 范 型 解决 重 载 的 问题 。 
仅仅 通过 查看 一 个 函数 的 参数 类 型 不 一 定 能 够 解决 重 载 问题 。 在 , Ada 中 ,一 个 子 表达 式 会 
有 一 组 可 能 的 类 型 , 而 不 是 只 有 一 个 确定 的 类 型 。 它 所 在 的 上 下 文 必须 提供 足够 的 信息 来 缩小 
可 选 范 围 , 最 终 得 到 唯一 的 可 选 类 型 ( 见 练 习 6. 5.2)。 
6.5.4 “类 型 推导 和 多 态 函 数 
类 型 推导 常用 于 像 ML 这 样 的 语言 。ML 是 一 个 强 类 型 语言 , 但 是 它 不 要 求 名 字 在 使 用 前 先 
进行 声明 。 类 型 推导 保证 了 和 名字 使 用 的 一 致 性 。 
术语 “多 态 ” 指 的 是 任何 可 以 在 不 同 的 参数 类 型 上 运行 的 代码 片段 。 在 本 节 中 , 我 们 考虑 参 
数 多 态 (parametric polymorphism) , 这 种 多 态 通 过 参数 和 类 型 变量 来 刻 划 。 我 们 使 用 图 6-28 中 的 
ML 程序 作为 一 个 贯穿 本 节 的 例子 。 该 程序 定义 了 一 个 函数 length, KA length 的 类 型 可 以 描述 
为 :“ 对 于 任何 类 型 a, length 函数 将 元 素 类 型 为 a 的 列表 映射 为 整 型 ”。 


fun length(x) = i 
if null(x) then 0 else length(tl(x)) + 1; 


(6. 10) 


图 6-28 ; 计算 一 个 列表 长 度 的 ML 程序 


REEI 在 图 6-28 F, KEF fun 引出 了 一 个 函数 定义 , 被 定义 的 函数 可 以 是 递归 的 。 这 个 程 
序 片段 定义 了 带 有 单个 参数 x 的 函数 length。 这 个 函数 的 函数 体 包 含 了 一 个 条 件 表达 式 。 预 定义 
的 函数 null 测试 一 个 列表 是 否 为 空 。 预 定义 函数 W(tail 的 缩写 ) 移 除 列表 中 的 第 一 个 元 素 , 然后 
返回 列表 的 余下 部 分 。 

函数 length 确定 一 个 列表 x 的 长 度 , 或 者 说 x 中 元 素 的 个 数 。 列 表 中 的 所 有 元 素 必须 具有 相 
同 的 类 型 。 不 管 列表 元 素 是 什么 类 型 , 都 可 以 用 length 函数 来 求 出 这 个 列表 的 长 度 。 在 下 面 的 表 
达 式 中 , length 被 应 用 到 两 种 不 同类 型 的 列表 中 (列表 元 素 用 “[” 和 “]” 括 起 来 ) : 


length(["sun", "mon" , "tue" |) +length([10,9,8,7]) (6. 11) 

字符 串 列表 的 长 度 为 3， 整 数列 表 的 长 度 为 4, 因此 表达 式 (6. 11) 的 值 为 7。 oO 
使 用 符号 VY ( 读 作 “对 于 任意 类 型 ” ) 以 及 类 型 构造 算 子 list, length 的 类 型 可 以 写作 : 

V a. list( a) integer (6.12) 


符号 V 是 全 称 量词 (wiversal quantifier)， 它 所 作用 的 类 型 变量 称 为 受 限 的 (bound) 。 受 限 变 量 可 以 
被 任意 地 重 命名 , 但 是 需要 把 这 个 变量 的 所 有 出 现 一 起 重 命名 。 因 此 ,类 型 表达 式 
VB. list(B)—rinteger 和 式 (6. 12) 等 价 。 其 中 带 有 VY 符号 的 类 型 表达 式 被 称 为 “多 态 类 型 ”。 

在 多 态 函 数 的 各 次 应 用 中 ,函数 的 受 限 的 类 型 变量 可 以 表示 不 同 的 类 型 。 在 类 型 检查 中 , 每 
次 使 用 多 态 类 型 时 , 我 们 将 受 限 变量 蔡 换 为 新 的 变量 , 并 去 掉 相应 的 全 称 量词 。 
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下 一 个 例子 对 length 类 型 进行 了 非 正式 的 推导 ,推导 过 程 中 隐 式 地 使 用 了 公式 (6.9) 中 的 推 
导 规 则 。 这 里 再 重复 一 下 : 
if f) 是 一 个 表达 式 
then 对 某 些 a AB, 了 的 类 型 为 a->B 且 x 的 类 型 为 a 
URMEI E 6-29 中 的 抽象 语法 树 表 示 图 6-28 中 对 length 的 定义 。 这 棵 树 的 根 的 标号 为 fun, 
它 表示 函数 定义 。 其 他 的 非 叶 子 结 点 可 以 看 作 是 函数 应 用 。 fun 


标号 为 + 的 结 点 表示 对 两 个 子 结 点 应 用 运算 符 +。 类 似 的 ， wt l 

标号 为 站 的 结 点 表示 将 运算 符 放 应 用 于 它 的 三 个 子 结 点 组 成 en 

的 三 元 组 上 (对 于 类 型 检查 , 究竟 是 then 分 支 还 是 else 分 支 en aac 

被 求 值 并 不 是 问题 。 它 们 不 会 被 同时 计算 ) 。 7 
RATEI VA ARE BRAC length 的 函数 体 推导 出 它 的 类 型 。 从 入 

左 到 右 考虑 标号 为 证 的 结 点 的 子 结 点 。 因 为 mull 要 被 应 用 在 Himig 

列表 上 , 所 以 x 必须 是 一 个 列表 。 我 们 使 用 变量 a 作为 列表 W62 628 中 的 函数 定义 

元 素 类 型 的 占 位 符 , 也 就 是 说 , x 的 类 型 为 “a 的 列表 ”。 对 应 的 抽象 语法 分 析 树 


MR null(x) HE, W length(x) 为 0。 因 此, length 的 类 型 一 定 是 < 从 a 的 列表 到 整 型 的 函 
数 ”"。 这 个 推导 得 到 的 类 型 和 在 else 分 支 length (tl(x)) +1 X} length 的 使 用 是 一 致 的 。 E 

因为 在 类 型 表达 式 中 可 能 出 现 变 量 , 所 以 我 们 必须 重新 审视 一 下 类 型 等 价 的 概念 。 设想 将 
类 型 为 ->s' 的 E, 应 用 到 类 型 为 上 的 到 上 。 我 们 不 能 简单 地 确定 * 和 + 是 否 等 价 , 而 是 必须 将 这 
两 种 类 型 “ 合 一 ”。 非 正式 地 讲 , 我 们 将 确定 是 否 可 以 将 类 型 变量 8 和 1 替换 为 特定 的 类 型 表达 
A, 从 而 使 得 s 和 + 在 结构 上 等 价 。 

置换 (substitution) 是 一 个 从 类 型 变量 到 类 型 表达 式 的 映射 。 我 们 把 对 类 型 表达 式 ; 中 的 变量 
应 用 置换 S 后 得 到 的 结果 写作 SO), 详细 信息 请 参见 “置换 、 实例 和 合 一 ”部 分 。 两 个 类 型 表达 
HA ty 和 可 以 合 一 (unigy) 的 条 件 是 存在 某 个 置换 SE S) =S) 。 在 实践 中 , 我 们 感 兴趣 
的 是 最 一 般 化 的 合 一 置换 , 这 种 合 一 置换 对 表达 式 中 的 变量 施加 的 约束 最 少 。6. 5. 5 节 给 出 了 一 
企 合 元 算 法 5 





置换 .实例 和 合 一 

WMR t 是 一 个 类 型 表达 式 , H SE-NR 即 一 个 从 类 型 变量 到 类 型 表达 式 的 映射 ) ， 
那么 我 们 用 SO 来 表示 将 1 中 的 每 个 类 型 变量 a 的 所 有 出 现 替 换 为 $S(w) 后 得 到 的 结果 。 
S(t) BAKA t 的 一 个 实例 (instance)。 例 如 , list( integer) Æ list(a) 的 一 个 实例 ， 因为 它 是 将 list 
(a) PHI a BRA integer 后 的 结果 。 然 而 , 请 注意 integer-»float 不 是 asa 的 实例 , 因为 置换 
必须 将 a 的 所 有 出 现 蔡 换 为 相同 的 类 型 表达 式 。 

对 于 类 型 表达 式 广 Mta, WR S) =S), 那么 置换 5 就 是 一 个 含 一 替换 ( unifier ) 。 
如 果 对 于 志和 的 任何 合 一 替换 ,比如 说 5', 下 面 的 条 件 成 立 : 对 于 任意 的 1， S'(t) Æ S(t) 
的 一 个 实例 , 那么 我 们 就 说 S Ht, Al tp 的 最 一 般 化 的 合 一 替换 (most general unifier) 。 换 句 话 
说 , 5' 对 tz 施加 的 限制 比 8 施 加 的 限制 更 多 。 











Gl 多 态 函 数 的 类 型 推导 。 


输入 : 一 个 由 一 系列 函数 定义 以 及 紧 跟 其 后 的 待 求 值 表达 式 组 成 的 程序 。 二 个 表达 式 由 多 
个 函数 应 用 和 名 字 构 成 。 这 些 名 字 具 有 预定 义 的 多 态 类 型 。 
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输出 : 推导 出 的 程序 中 名 字 的 类 型 。 
方法 : 为 简单 起 见 , 我 们 只 考虑 一 元 函数 。 对 于 带 有 两 个 参数 的 函数 f(xi , x), 我 们 可 以 将 
其 类 型 表示 为 sı xs 一 性 其 中 sı Alls, 分 别 是 x Al x2 的 类 型 , Tit 是 函数 成 xi %3) 的 结果 类 型 。 
通过 检查 s EDA a 的 类 型 匹配 ,ss 是 否 和 的 类 型 匹配 ,就 可 以 检查 表达 式 岂 <, b) 的 类 型 。 
检查 输入 序列 中 的 函数 定义 和 表达 式 。 当 一 个 函数 在 其 后 的 表达 式 中 被 使 用 时 ,就 使 用 推 
导 得 到 的 该 函数 的 类 型 。 
o 对 一 个 函数 定义 fun id, (id,) =E, 创建 一 个 新 的 类 型 变量 a MB. 将 函数 idi 与 类 型 
a 一 B 相 关联 , 参数 iay 和 类 型 a 相关 联 。 然 后 , 推导 出 表达 式 E 的 类 型 。 假 设 在 对 EE 进 
行 类 型 推导 之 后 , a 表示 类 型 而 B 表示 类 型 :。 推 导 得 到 的 函数 id 的 类 型 就 是 ;3t。 使 
用 VY 量词 来 限制 3-3t 中 任何 未 受 约束 的 类 型 变量 。 
e 对 于 函数 应 用 El(E;), 推导 出 El ME, 的 类 型 。 因 为 Ei 被 用 作 一 个 函数 , 它 的 类 型 一 
HAA ss’ 的 形式 (从 技术 上 来 说 , Ei MRAM Boy 合 一 ; 其 中 6 和 7Y 是 新 的 类 型 
变量 ) 。 假 定 推导 得 到 的 E, 的 类 型 为 1。 对 s 和 1 进行 合 一 处 理 。 如 果 合 一 失败 ，, 表达 式 
返回 类 型 错误 , 否则 推导 得 到 的 Ei (Es) 的 类 型 为 "6 
© 对 一 个 多 态 函 数 的 每 次 出 现 , 将 它 的 类 型 表达 式 中 的 受 限 变量 替换 为 互 不 相同 的 新 变量 , 并 
移 除 Y 量 词 。 替 换 得 到 的 类 型 表达 式 就 是 这 个 多 态 函 数 的 本 次 出 现 所 对 应 的 推导 类 型 。 
e 对 于 第 一 次 碰 到 的 变量 ,引入 一 个 新 的 类 型 变量 来 代表 它 的 类 型 。 g 
在 图 6-30 中 , 我 们 为 函数 length 推导 出 一 个 类 型 。 图 6-29 中 语法 树 的 根 表示 一 个 函 
数 定义 ,因此 我 们 引入 变量 B 和, 并 将 类 型 By 关联 到 函数 length, 将 B 关 联 到 x。 见 图 6-30 
的 1~2 行 。 
在 根 的 右 子 结 点 上 , 我 们 把 站 看 作 一 个 应 用 到 三 元 组 上 的 多 态 函 数 , 这 个 三 元 组 包括 一 个 布 
尔 型 变量 以 及 两 个 分 别 代 表 then 和 else 分 支 的 表达 式 。 函 数 半 的 类 型 是 Va. boolean x a x aao 
多 态 函 数 的 每 次 应 用 可 能 作用 于 不 同 的 类 型 , 因此 我 们 构造 一 个 新 的 临时 变量 a; (i 取 自 
if), 并 移 除 VY ， 见 图 6-30 中 的 第 三 行 。 函 数 站 的 左 子 结 点 的 类 型 必须 和 boolean 类 型 合 一 , 其 他 
两 个 子 结 点 的 类 型 必须 和 a; 合 一 


ee ee 


length : 8> y 





if : boolean x a; X ai > Qi 

: list(an) 一 boolean 

: boolean list(an) = B 

: integer a; = integer 

: integer x integer —> integer 

: list(az) > list(az) 

: list(az) list(a;) = list(an) 

length(tl(x)) : y y= integer 

1 : integer 





length(t(x)) + 1 : integer 
if( --- ) : integer 


图 6-30 ”推导 图 6-28 中 的 函数 length 的 类 型 
预定 义 函 数 null 的 类 型 为 Va. nt(a) 一 booleonz。 我 们 使 用 一 个 新 的 类 型 变量 a, EP n 表示 
null ) 来 替换 受 限 变量 a, 见 第 4 行 。 因 为 null 被 应 用 于 x, 我 们 推导 出 x 的 类 型 B 必须 和 list (cx, ) 
匹配 , 见 第 5 行 
在 站 的 第 一 个 子 结 点 上 , null(x) 的 类 型 boolean 和 证 函数 预期 的 类 型 相 匹配 。 在 第 二 个 子 结 
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点 上 ,类 型 a; 与 integer 进行 合 一 , 见 第 6 行 。 

现在 考虑 子 表达 式 lengih(t(x))+1。 我 们 为 类 型 中 的 约束 变量 a 建立 新 的 临时 变量 a, (其 
中 :表示 “tail”), 见 第 8 行 。 根据 九 (*) 的 应 用 ， 我 们 推导 出 list(a,) = B=list(a,), 见 第 9 行 。 

因为 length( 刀 (x) ) 是 + 的 一 个 运算 分 量 , 它 的 类 型 7 必须 和 integer 合 一 , 见 第 10 行 。 可 以 
推出 length 的 类 型 为 lisi( a ) integers 在 检查 完 这 个 函数 定义 之 后 , 类 型 变量 a, 仍然 保留 在 
length 的 类 型 中 。 因 为 没有 对 a 作出 任何 假设 ， 当 使 用 该 函数 时 a 可 以 被 替换 为 任何 类 型 。 因 
此 ,我 们 可 以 把 它 变 成 一 个 受 限 变量 , 并 把 length 的 类 型 写作 : 

Y a. list( a, ) integer oO 
6.5.5 一 个 合 一 算法 

非 正 式 地 讲 , 合 一 就 是 判断 能 否 通过 将 两 个 表达 式 和 1 中 的 变量 蔡 换 为 某 些 表达 式 , 使 得 
和 1 相同。 测试 表达 式 是 否 等 价 是 合 一 的 一 个 特殊 情况 。 如 果 s 和 + 中 只 有 常量 没有 变量 , W s 和 
; 合 二 当量 仅 当 它们 完全 相同 。 本 节 中 的 合 一 算法 可 以 处 理 含有 环 的 图 ,因此 它 可 以 用 于 测试 御 
环 类 型 的 结构 等 价 性 9。 

我 们 将 实现 一 种 基于 图 论 表 示 方 法 的 合 一 算法 , 其 中 类 型 被 表示 成 图 的 形式 。 类 型 变量 用 
叶子 结 点 表示 ,类 型 构造 算 子 用 内 部 结 点 表示 。 结 点 被 分 成 若干 的 等 价 类 。 如 果 两 个 结 点 在 同一 
个 等 价 类 中 ,那么 它们 代表 的 类 型 表达 式 就 必须 合 一 。 因 此 ,同一 个 等 价 类 中 的 内 部 结 点 必须 具 
有 同样 的 类 型 构造 算 子 , 且 它 们 的 对 应 子 结 点 必须 等 价 。 
考虑 下 列 两 个 类 型 表达 式 

( (araz) X list( a3) )—list( a) 
((a3—a4) x list( az) ) as 


下 列 的 置换 S 是 这 两 个 表达 式 的 最 一 般 化 的 合 一 蔡 换 : 


x S(x) 
ay ay 
a a2 
a3 ay 
a4 az 
Qs list (a ) 


这 个 置换 将 上 述 两 个 类 型 表达 式 映射 成 如 下 的 表达 式 
( (aay) x list( ay )) list (a2) 


这 两 个 表达 式 被 表示 为 图 6-31 中 标号 为 一 : 1 的 两 个 结 扩 。 结 点 上 的 整数 编号 指明 了 在 编号 为 1 


的 结 点 被 合 一 后 , 各 个 结 点 所 属 的 等 价 类 的 编号 。 oO 

>: 1 a1 

: a 

x2 list: 8 x2 a5 :8 

x ta 

3:3 list: 6 一 :3 list: 6 
7 he 
a1: 4 a2: 5 a3:4 a4: 5 


图 6-31 合 一 后 的 等 价 类 





铝 ， 在 有 些 应 用 中 ,对 一 个 变量 和 一 个 包含 该 变量 的 表达 式 进行 合 一 是 错误 的 。 算 法 6. 19 允许 这 种 替换 。 
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类 型 图 中 的 一 对 结 点 的 合 一 处 理 。 
输入 : 一 个 表示 类 型 的 图 ,以 及 需要 进行 合 一 处 理 的 结 点 对 m A no 
输出 : 如 果 结 点 mn 和 表示 的 表达 式 可 以 合 一 , 返回 布尔 值 rues 反之 , 返回 false。 
方法 : 结 点 用 一 个 记录 实现 , 记录 中 的 字段 用 于 存放 一 个 二 元 运算 符 和 分 别 指向 其 左右 子 结 
点 的 指针 。 字 段 set 用 于 保存 等 价 结 点 的 集合 。 每 个 等 价 类 都 有 一 个 结 点 被 选 作 这 个 类 的 唯一 代 
表 , 它 的 set 字段 包含 一 个 室 指 针 。 等 价 类 中 其 他 结 点 的 set 字段 ( 可 能 通过 该 集合 中 的 其 他 结 点 
间接 地 ) 指向 该 等 价 类 的 代表 结 点 。 在 初始 时 刻 , 每 个 结 点 n 自身 组 成 一 个 等 价 类 , n 是 它 自己 
的 代表 结 点 。 
如 图 6-32 所 示 的 合 一 算法 在 结 点 上 进行 如 下 两 种 操作 : 
。find(n) 返 回 当前 包含 结 点 的 等 价 类 的 代表 结 点 。 
。union(m, n) 将 包含 结 点 m 和 n 的 等 价 类 合并 。 如 果 m 和 n 所 对 应 的 等 价 类 的 代表 结 点 
中 有 一 个 是 非 变 量 的 结 点 , 则 union 将 这 个 非 变量 结 点 作为 合并 后 的 等 价 类 的 代表 结 点 ; 
否则 ,union 把 任意 一 个 原 代表 结 点 作为 新 的 代表 结 点 。 这 种 在 union 的 规约 中 的 非 对 称 
性 非常 重要 , 因为 如 果 一 个 等 价 类 对 应 于 一 个 带 有 类 型 构造 算 子 的 类 型 表达 式 或 基本 类 
型 ,我们 就 不 能 用 一 个 变量 作为 该 等 价 类 的 代表 。 否 则 ,两 个 不 等 价 的 表达 式 可 能 会 通 
过 该 变量 被 合 一 。 





boolean wnify( Node m, Node n) { 
s = find(m); t = find(n); 
if ( s = t ) return true; 
else if (4A 5 和 t+ 表示 相同 的 基本 类 型 ) return true; 
else if (s 是 一 个 带 有 子 结 点 51 和 52 的 o 信 结 点 and 
上 是 一 个 带 有 子 结 点 页 和 万 的 o 产 结 点 ) { 
union(s, t); 
return unify(s,,t,) and unify(s2, tz); 


} 

else if (5 或 者 1 表示 一 个 变量 ){ 
union(s, t); 
return true; 


else return false; 





图 6-32 合 一 算法 


集合 的 union 操作 的 实现 很 简单 ,只 需要 改变 一 个 等 价 类 的 代表 结 点 的 see 字段 , 使 之 指向 男 
一 个 等 价 类 的 代表 结 点 即 可 。 为 了 找到 一 个 结 点 所 属 的 等 价 类 , 我 们 沿 着 各 个 结 点 的 se 字段 中 
的 指针 前 进 , 直到 到 达 代 表 结 点 ( 即 set 字段 指针 为 空 指针 的 结 点 ) 为 止 。 

请 注意 , 图 6-32 中 的 算法 分 别 使 用 s =find(m) Ml t=find(n), 而 不 是 直接 使 用 m 和 nn。 如 果 
m 和 在 同一 个 等 价 类 中 , 那么 代表 结 点 s 和 相等。 如果 s 和 + 表示 相同 的 基本 类 型 ， 则 调用 
unify(m, n) 返 回 true。 如 果 s 和 上 都 是 代表 某 个 二 目 类 型 构造 算 子 的 内 部 结 点 , 那么 我 们 尝试 合 
并 它们 的 等 价 类 ， 并 递归 地 检查 它们 的 各 个 子 结 点 是 否 等 价 。 因 为 首先 进行 合并 操作 , RIER 
归 检 查 子 结 点 之 前 减少 了 等 价 类 的 个 数 , 因此 算法 终止 。 

将 一 个 变量 置换 为 一 个 表达 式 的 实现 方法 如 下 : 把 代表 该 变量 的 叶子 结 点 加 入 到 代表 该 表 
达 式 的 结 点 所 在 的 等 价 类 中 。 假设 m 或 n 表示 一 个 变量 的 叶子 结 点 , 同时 假设 这 个 结 点 已 经 放 
入 满足 下 面条 件 的 等 价 类 中 , 即 这 个 等 价 类 中 的 一 个 结 点 代表 的 表达 式 或 者 带 有 一 个 类 型 构造 
BF, 或 者 是 一 个 基本 类 型 。 那么, find 将 会 返回 一 个 反映 该 类 型 构造 算 子 或 基本 类 型 的 代表 结 
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点 , 使 一 个 变量 不 会 和 两 个 不 同 的 表达 式 合 一 。 口 
假设 例 6. 18 中 的 两 个 表达 式 可 以 用 图 6-33 中 的 两 个 初始 图 表示 ， 图 中 的 每 个 结 点 所 
在 的 等 价 类 仅仅 包含 该 结 点 。 当 应 用 算法 ©. 19 来 计算 unify (1, 9) 时 ， 注 意 到 结 点 1 和 9 表示 同 
_ 个 运算 符 。 因 此 将 结 点 1 和 9 合并 成 同一 个 等 价 类 , 并 调用 unify (2, 10) Al unify (8, 14) 0 W 


{F unify(1, 9) 得 到 的 结果 就 是 前 面 在 图 6-31 中 显示 的 图 。 回 
一 :1 3:9 
2 list:8 i 10 a5: 14 
>: e list : 6 +: 11 list: 13 
Ao a 


ay: 4 a2:5 a3: 7 ag : 12 
图 6.33， 初 始 图 ,其 中 的 每 个 结 点 在 只 包含 该 结 点 自身 的 等 价 类 中 


如 果 算 法 6 19 返回 true, 我 们 可 以 按照 如 下 方法 构造 出 一 个 置换 $ 作为 合 一 替换 。 对 于 每 
个 变量 a, find(a) 给 出 a 的 等 价 类 的 代表 结 点 n。n 所 表示 的 表达 式 为 Sla) o 例如 , 在 图 6-31 中 ， 
我 们 看 到 a, 的 代表 结 点 为 4, 这 个 结 点 表示 a1。 结 点 8 是 as 的 代表 结 点 , 这 个 结 点 表示 list (az) o 
置换 S 的 结果 如 例 6. 18 所 示 。 
6.5.6 6.5 节 的 练习 

练习 6. 5. 1: 假定 图 6-26 中 的 函数 widen 可 以 处 理 图 6-25a 的 层次 结构 中 的 所 有 类 型 ， 翻 译 
FIRER. BE c Md 是 字符 型 , s 和 1 是 短 整 型 , i 和 j 为 整 型 ,x 是 浮 点 型 。 

1) > 

2) i = 8 + ¢ 

3) x= (s +c) * (te + 4) 

练习 6. 5.2: 像 Ada 中 那样 , 我 们 假设 每 个 表达 式 必 须 具 有 唯一 的 类 型 ， 但 是 我 们 根据 一 个 
子 表达 式 本 身 只 能 推导 出 一 个 可 能 类 型 的 集合 。 也 就 是 说 , 将 函数 E 应 用 于 参数 E,( 其 文法 产 
生 式 为 E 一 E1(E,)) 有 如 下 规则 : 

E. type = |t | X} En. type 中 的 某 个 s, st 在 El. type 中 | 

描述 一 个 可 以 确定 每 个 子 表 达 式 的 唯一 类 型 的 语法 制导 定义 (SDD)。 它 首先 使 用 属性 type, 按照 
自 底 向 上 的 方式 综合 得 到 一 个 可 能 类 型 的 集合 。 在 确定 了 整个 表达 式 的 唯一 类 型 之 后 , A 
下 地 确定 属性 unique 的 值 , 这 个 属性 表示 各 个 子 表达 式 的 类 型 。 


6.6 控制 流 


if-else 语句 while 语句 这 类 语句 的 翻译 和 对 布尔 表达 式 的 翻译 是 结合 在 一 起 的 。 在 程序 设 
计 语言 中 , 布尔 表达 式 经 常用 来 : 

1) 改变 控制 流 。 布 尔 表达 式 被 用 作 语 句 中 改变 控制 流 的 条 件 表达 式 。 这 些 布尔 表达 式 的 值 
由 程序 到 达 的 某 个 位 置 隐 含 地 指出 。 例 如 , 在 站 (E) $ 中 ,如 果 运 行 到 语句 5, 就 意味 着 表达 式 E 
的 取 值 为 真 。 

2) 计算 逻辑 值 。 一 个 布尔 表达 式 的 值 可 以 表示 true R false. 这 样 的 布尔 表达 式 也 可 以 像 算 
术 表 达 式 一 样 ,使 用 带 有 逻辑 运算 符 的 三 地 址 指令 进行 求 值 。 

布尔 表达 式 的 使 用 意图 要 根据 其 语法 上 下 文 来 确定 。 例 如 , 跟 在 关键 字 证 后 面 的 布尔 表达 
式 用 来 改变 控制 流 ， 而 一 个 赋值 语句 右 部 的 表达 式 用 来 表示 一 个 逻辑 值 。 有 多 种 方式 可 以 描述 
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这 样 的 上 下 文 : 我 们 可 以 使 用 两 个 不 同 的 非 终结 符号 ， 也 可 以 使 用 继承 属性 , 还 可 以 在 语法 分 析 
过 程 中 设置 一 个 标记 。 此 外 ， 我 们 还 可 以 建立 一 棵 语法 分 析 树 并 调用 不 同 的 过 程 来 处 理 布尔 表 
达 式 的 两 种 不 同 的 使 用 。 

本 节 将 介绍 用 于 改变 控制 流 的 布尔 表达 式 。 更 清楚 地 说 ， 我 们 为 此 引入 一 个 新 的 非 终结 符 
aB, 在 6.6.6 节 中 , 我 们 将 考虑 编译 器 如 何 使 得 布尔 表达 式 表示 录 辑 值 。 
6.6.1 布尔 表达 式 

布尔 表达 式 是 将 由 作用 于 布尔 变量 或 关系 表达 式 的 布尔 运算 符 而 构成 的 。 我 们 使 用 C 语言 
的 方法 , 用 &&、|| 、! 分 别 表 示 AND、OR、NOT 运算 符 。 关 系 表达 式 的 形式 为 E rel Ez 其 中 ， 
E, ME, 为 算术 表达 式 。 在 本 节 中 ， 我 们 考虑 的 是 由 如 下 文法 生成 的 布尔 表达 式 : 

BoBI|BIB&&BI!BI(B) | Erel E | true | false 

我 们 通过 属性 rel op 来 指明 rel 究竟 表示 6 种 比较 运算 符 <、<=、=、!=、> 和 >= 中 的 哪 
一 种 。 按 照 惯 例 , 假设 | 和 && 是 左 结 合 的 ,| 的 优先 级 最 低 , 其 次 为 &&, 再 其 次 为 !。 

给 定 表达 式 Bi || By, 如 果 我 们 已 经 确定 B 为 真 , 那么 不 用 再 计算 B, 就 可 以 断定 整个 表达 
式 为 真 。 同 样 的 , 给 定 BRB, WME B 为 假 , 则 整个 表达 式 为 假 。 

程序 设计 语言 的 语义 定义 决定 了 是 否 需 要 对 一 个 布尔 表达 式 的 各 个 部 分 都 进行 求 值 。 如 果 
语言 的 定义 允许 (或 要 求 ) 不 对 布尔 表达 式 的 某 个 部 分 求 值 , 那么 编译 器 就 可 以 优化 布尔 表达 式 
的 求 值 过 程 , 只 要 已 经 求 值 的 部 分 足以 确定 整个 表达 式 值 就 可 以 了 。 因 此 , EREA B |B H, 
B, 和 B， 都 不 一 定 要 完全 地 求 值 。 如 果 By 或 Bs 是 具有 副作用 的 表达 式 ( 比如 害 包 含 秆 改变 一 个 
全 局 变量 的 函数 ) , 那么 这 么 做 就 可 能 会 得 到 意料 之 外 的 结果 。 
6.6.2 短路 代码 

在 短路 ( 跳 转 ) 代 码 中 , 布尔 运算 符 &&、|| 和 ! 被 翻译 成 跳 转 指令 。 运 算 符 本 身 不 出 现在 代 
码 中 , 布尔 表达 式 的 值 是 通过 代码 序列 中 的 位 置 来 表示 的 。 





语句 if x < 100 goto Lz 

if (x<100 || x>200 && x! =y) x=0; ifFalse x > 200 goto Lı 
可 以 被 翻译 成 图 6-34 所 示 的 代码 。 在 这 个 翻译 中 , 如 果 程序 的 控 | Ease x I= ¥ ove n 
制 流 到 达 Lz, 就 表示 这 个 布尔 表达 式 为 真 。 如 果 表 达 式 为 假 , 则 
程序 控制 流 将 跳 过 L2 和 赋值 语句 x =0, 直接 转 到 Li。 El 
6.6.3 ”控制 流 语句 图 6-34 ， 跳 转 代码 


现在 我 们 考虑 在 按 下 列 文法 生成 的 语句 的 上 下 文中 , 如 何 

把 布尔 表达 式 翻 译 成 为 三 地 址 代码 。 
S— if (B) Si 
S— if (B) S, else S, 

S— while (B) S, 

在 这 些 产 生 式 中 , 非 终结 符号 表示 一 个 布尔 表达 式 , 非 终 结 符号 S 表示 一 个 语句 。 

这 个 文法 将 例 5. 19 中 介绍 的 关于 while 表达 式 的 连续 使 用 的 例子 进行 了 推广 。 和 那个 例子 
一 样 , BAIS 有 综合 属性 code, 该 属性 给 出 了 翻译 得 到 的 三 地 址 指令 。 为 简单 起 见 , 我 们 使 用 语 
法 制导 定义 来 构造 得 到 翻译 结果 B. code 和 S. code, 结果 值 是 字符 串 。 定 义 了 code 属性 的 语义 规 
则 还 可 以 按照 下 面 的 方法 实现 : 首先 构造 语法 树 , 并 在 遍历 树 的 过 程 中 产生 目标 代码 。 这 些 规则 
还 可 以 通过 5.5 节 中 列 出 的 任何 方法 来 实现 。 

如 图 6-35a 所 示 , 对 站 (8B) S, 的 翻译 结果 中 包含 了 B. code, 其 后 是 S1. codes B. code 中 存在 基 
于 B 值 的 跳 转 。 如 果 B 为 真 , 控制 流转 向 S1. code 的 第 一 条 指令 ; WR BAL, 控制 流 立即 转向 
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紧 跟 在 S}. code 之 后 的 指令 。 























to B.true -——_——. to B. true 
B.code nie B.code B. fal 
.code code 
to B.false to B.false 
f $ B.t t 
ine Si.code Me Sı -code 
B.false : s.. goto S.nezt 
B.false : 
a) if Ke S2.code 
rae to B.true 
in : i 
eg Bide to Bube S.nert : 
ates i 
Bitrue': b) if-else 
ie Si.code 
goto begin 
B.false : e 








c) while 
图 6-35 if, if-else, while 语句 的 代码 


B. code 和 S. code 中 的 跳 转 标号 使 用 继承 属性 来 处 理 。 我 们 将 布尔 表达 式 B 和 两 个 标号 : 
B. true 和 B. false 相关 联 。 当 B 为 真 时 控制 流转 到 B. true; 当 B 为 假 时 控制 流转 到 B. falses RI 
将 语句 $ 和 继承 属性 S. next 相关 联 , 这 个 属性 表示 紧 跟 在 5 代码 之 后 的 指令 的 标号 。 在 某 些 情况 
F, RIRE S. code 之 后 的 指令 是 一 个 跳 转 到 某 个 标号 工 的 跳 转 指令 。 使 用 S. next 可 以 避免 在 
S. code 中 出 现 这 样 的 一 个 跳 转 指令 , 它 的 目标 又 是 一 个 以 L 为 目标 的 跳 转 指令 。 

图 6-36 和 图 6-37 给 出 的 语法 制导 定义 可 以 为 在 让 、if-else 及 while 语句 的 上 下 文中 的 布尔 表 
达 式 生成 三 地 址 代码 。 

语义 规则 


P> S S.next = newlabel() 
P.code = S.code || label(S.neat) 





S + assign S.code = assign.code 


S > if(B)S; B.true = newlabel() 
B.false = S,.next = S.nezt 
S.code = B.code || label(B.true) || S1.code 


S + if( B) Sı else S2 | B.true = newlabel() 
B.false = newlabel() 
S;.nett = So.next = S.neat 
S.code = B.code 


|| label(B.true) || S1.code 
|| gen(‘goto’ S.neat) 
|| label(B. false) || S2.code 


S + while(B) Sı begin = newlabel() 
B.true = newlabel() 
B.false = S.next 
S;.nezt = begin 
S.code = label(begin) || B.code 
|| label(B.true) || S1.code 
|| gen('goto’ begin) 


S;.next = newlabel() 
So.next = S.nest 
S.code = Si.code || label(S,.next) || S2.code 


图 6-36， 控 制 流 语句 的 语法 制导 定义 
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我 们 假定 每 次 调用 newlabel( ) 都 会 产生 一 个 新 的 标号 ， 并 假设 label(L) 将 标号 上 附加 到 即将 
生成 的 下 一 条 三 地 址 指令 上 口 。 

一 个 程序 包含 一 条 由 产生 式 PS 生成 的 语句 。 和 这 个 产生 式 关联 的 语义 规则 将 5. next 初始 
化 为 一 个 新 标号 。P. code 包含 S. code, S. code 之 后 是 新 标号 5. next。 产 生 式 S—assign 中 的 词法 
单元 assign 是 一 个 表示 赋值 语句 的 占 位 符 。 赋值 语句 的 翻译 和 6.4 节 中 讨论 的 方法 相同 。 在 这 
里 对 控制 流 的 讨论 中 ,5. code 就 是 assign. code. 

在 翻译 S$_>if (B) S, 时 , 图 6-36 中 的 语义 规则 创建 一 个 新 的 标号 B. true, 并 将 其 关联 到 为 语 
句 S, 生成 的 第 一 条 三 地 址 指令 中 , 如 图 6-35a 所 示 。 因此 , B 的 代码 中 跳 转 到 B. true 的 指令 将 跳 
转 到 语句 51 对 应 的 代码 处 。 不 仅 如 此 , 通过 将 B. false 设 为 5. next, 我 们 保证 了 当 B 的 值 为 假 时 ， 
控制 流 将 跳 过 51 的 代码 。 

在 翻译 if-else 语句 Sif (B) Si else S, 时 , 布尔 表达 式 B 的 代码 中 有 一 些 向 外 跳 转 的 指令 ， 
它们 在 B 为 真 时 跳 转 到 51 的 代码 的 第 一 条 指令 ; 在 8B 为 假 时 跳 转 到 5， 的 代码 的 第 一 条 指令 , 如 
图 6-35b 所 示 。 然 后 ; 控制 流 从 Si X S 转 到 紧 跟 在 5 的 代码 之 后 的 三 地 址 指令 一 一 该 指令 的 标 
号 由 继承 属性 S. next HE. TES, 的 代码 之 后 有 一 条 goto S. next 指令 ， 使 得 控制 流 越过 5, 的 代 
码 。5, 的 代码 之 后 不 需要 goto WA, 因为 $2. next 就 是 S. next. 

如 图 6-35c 所 示 , Swhile(B)S, 的 代码 由 B. code Fil S,- code 组 成 。 我 们 使 用 一 个 局 部 变量 
begin 来 存放 附加 在 这 个 while 语句 的 第 一 条 指令 上 的 标号 。 这 个 while 语句 的 第 一 条 指令 也 是 B 
的 第 一 条 指令 。 我 们 在 这 里 使 用 变量 而 不 是 属性 , 是 因为 begin 对 于 这 个 产生 式 的 语义 规则 而 言 
是 局 部 的 。 继 承 属性 S. next 标记 了 当 B 为 假 时 控制 流 必须 转向 的 标号 。 因此 , B. false 被 设置 为 
S. next, TES, 的 第 一 条 指令 上 附加 了 一 个 新 标号 B. true, B 的 指令 中 的 跳 转 指令 在 B 为 真 时 跳 转 到 
这 个 标号 。 我们 在 S, 的 代码 之 后 放置 了 一 条 指令 goto begin, 它 跳 回 到 布尔 表达 式 的 代码 的 开始 
处 。 请 注意 , S,. next 被 设置 为 标号 begin, 因此 从 S1. code 中 跳出 的 指令 可 以 直接 跳 转 到 begino 

SSS, 的 代码 包含 了 51 的 代码 , 然后 是 S 的 代码 。 相应 的 语义 规则 主要 处 理 标号 。51 的 
代码 之 后 的 第 一 条 指令 就 是 5, 的 代码 的 起 始 指 令 。 紧 跟 在 S2 的 代码 之 后 的 指令 也 是 跟 在 5 的 
代码 之 后 的 指令 。 l 

我 们 将 在 6.7 节 中 进一步 讨论 控制 流 语句 的 翻译 。 在 那里 我 们 将 使 用 另 一 种 被 称 为 回填 的 
方法 , 它 可 以 在 一 次 扫描 中 生成 各 个 语句 的 代码 。 

6.6.4 布尔 表达 式 的 控制 流 翻译 

图 6.37 中 针对 布尔 表达 式 的 语义 规则 是 图 6-36 中 语句 的 语义 规则 的 一 个 补充 。 如 图 6-35 中 
的 代码 布局 方案 所 示 , 二 个 布尔 表达 式 B 被 翻译 为 一 个 三 地 址 指令 ， 它 将 使 用 条 件 或 无 条 件 跳 转 
指令 来 对 B 求 值 。 这 些 跳 转 指令 的 目标 是 两 个 标号 之 一 : 当 B 为 真 时 是 B. true; 当 B JRH Æ 
B. falses 

图 6-37 中 的 第 四 个 产生 式 , 即 BE, rel E,, 直接 被 翻译 成 三 地 址 比较 指令 ， 跳 转 到 正确 的 
位 置 。 例 如 , a <b 被 翻译 成 : 


if a < b goto B.true 
goto B.false 





O ”如果 严格 地 按照 上 面 的 语义 规则 来 实现 ; 这 些 语义 规则 将 产生 很 多 标号 ， 并 可 能 在 一 个 三 地 址 指令 上 附加 多 个 标 
号 。6.7 节 中 介绍 的 回填 技术 只 在 必要 的 时 候 创建 标号 。 处 理 这 个 问题 的 另 一 种 方法 是 在 后 续 的 优化 步骤 中 消除 
不 必要 的 标号 。 
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B,.true = B.true 

Bi.false = newlabdel() 

By.true= B.true 

Bo. false = B.false 

B.code = By.code || label(B,.false) || Bo.code 


















B > Bill Bo 













B > Bı && Bz | Bı.true = newlabel() 
B,.false = B.false 
By.true = B.true 
By. false = B. false 
B.code = Bi.code || label(B,.true) || Bo.code 










Bi.true = B.false 
B,.false = B.true 
B.code = B,.code 











B > E, rel Ey | B.code = E,.code || Ez.code 
|| gen(‘it! Ey .addr rel.op E>.addr ‘goto! B.true) 


|| gen('goto’ B. false) 








B.code = gen('goto’ B.true) 





B.code = gen('goto' B.false) 


图 6-37 为 布尔 表达 式 生 成 三 地 址 代码 


B 的 其 余 产 生 式 按照 下 面 的 方法 翻译 : 

1) 假定 B 形 如 By || By. WRB, 为 真 , 那么 我 们 立刻 知道 B 本 身 也 为 真 , 因此 B. true 和 
B. true 相同 。 如 果 By 为 假 , 那么 就 必须 对 B, RE, 因此 我 们 将 B. false 设置 为 B, 的 代码 的 第 一 
条 指令 的 标号 。B, 的 真 假 出 口 分 别 等 于 B 的 真 假 出 口 。 

2) By &&B, 的 翻译 方法 类 似 于 1。 

3) 不 需要 为 81! Bi 产生 新 的 代码 , 只 需要 将 B 中 的 真 假 出 口 对 换 , 就 可 分 别 得 到 B, 的 真 
假 出 口 。 

4) 将 常量 true 和 false 分 别 翻译 成 目标 为 B. true 和 


if x < 100 goto Lz 


B. false 的 跳 转 指令 。 
重新 考虑 例 6.21 中 的 下 列 语句 ; Noh digas 

if (x<100 || x>200 && x!=y)x=0; (6.13) : if x != y goto Lz 
使 用 图 6-36 和 图 6-37 中 的 语法 制导 定义 ,我 们 可 以 得 到 ati 


图 6-38 中 的 代码 。 

语句 (6. 13) 是 图 6-36 中 的 产生 式 PS 生成 的 一 个 
程序 。 这 个 产生 式 的 语义 规则 生成 了 $ 的 代码 之 后 的 第 图 5-38 一 个 简单 的 站 语句 的 
一 条 指令 的 新 标号 LI。 语句 S 的 形式 为 过 (8) S, 其 中 ane 
Sı 是 x=0。 因 此 , 图 6-36 中 的 规则 生成 了 一 个 新 标号 2 ,并 将 它 附 加 到 S, code 的 第 一 条 (在 这 
个 例子 中 也 是 唯一 的 ) 指 令 , Bll x =0 处 。 

因为 | 的 优先 级 低 于 &&, 所 以 式 (6.13) 中 的 布尔 表达 式 的 形式 为 Bi || By, 其 中 局 是 
x <100。 按 照 图 6-37 中 的 规则 ,Bi. true $È La, BAA x =0 的 标号 ; By. false 是 一 个 新 的 标号 Ly, 
它 附加 在 By 的 代码 的 第 一 条 指令 上 。 

值得 注意 的 是 ,生成 的 代码 不 是 最 优 的 , 因为 这 个 翻译 结果 比例 6.21 中 的 代码 多 三 条 ( goto) 
指令 。 指 令 goto L, 是 宛 余 的 , 因为 恰巧 就 是 下 一 条 指令 的 标号 。 如 果 像 例 6.21 中 那样 使 用 
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ifFalse 指令 , 而 不 使 用 if 指令 , 那么 两 条 goto Li 指令 也 可 以 被 消除 。 回 
6.6.5 ”避免 生成 元 余 的 goto 指令 
在 例 6. 22 中 , 比较 表达 式 x > 200 被 翻译 成 如 下 代码 片段 : 


if x > 200 goto L4 
goto Lı 
eae 


可 以 将 上 面 的 指令 替换 为 如 下 指令 : 
ifFalse x > 200 goto Lı 
wore 


ifFlase 指令 利用 了 控制 流 在 指令 序列 中 会 从 一 个 指令 自然 流动 到 下 一 个 指令 的 性 质 , 因 
此 当 *>200 时 ,控制 流 直接 “穿越 ?到 标号 L4 ,从 而 减少 了 一 个 跳 转 指令 。 

在 图 6-35 中 所 示 的 让 和 while 语句 的 代码 布局 中 ,$1 的 代码 紧 跟 在 布尔 表达 式 B 的 代码 之 
后 。 通 过 使 用 一 个 特殊 标号 “fal”( 即 “不 要 生成 任何 跳 转 指 令 ”), 我 们 可 以 修改 图 6-36 和 
图 6-37 中 的 语义 规则 , 支持 控制 流 从 B 的 代码 直接 穿越 到 Si 的 代码 。 图 6-36 中 的 产生 式 
S—if(B)S,; 的 新 语义 规则 将 B. true 设 为 fall: 


B.true = fall 
B.false = S;.nezt = S.next 
S.code = B.code || S,.code 


ZEW Hh, if-else 和 while 语句 的 规则 也 将 B. true HEH fallo 

现在 我 们 将 修改 布尔 表达 式 的 语义 规则 , 使 之 尽 可 能 地 允许 控制 流 穿 越 。 在 B. true 和 
B. false 都 是 显 式 的 标号 时 , 也 就 是 说 它们 都 不 等 于 fall 时 , 图 6-39 中 的 BoE, rel E, 的 新 规则 将 
产生 两 条 指令 (和 图 6-37 一 样 ) 。 和 否则 , 如 果 B. true 是 显 式 的 标号 , 那么 B. false 一 定 是 fall, 因此 
它们 产生 一 条 if 指令 , 使 得 当 条 件 为 假 时 控制 流 穿越 到 下 一 条 指令 。 反 过 来 , 如 果 B. false 是 显 
式 的 标号 , 那么 它们 产生 一 条 ifFalse 指令 。 在 其 余 情 况 中 , B. true 和 B. false 都 是 fall, 因此 不 
产生 任何 跳 转 指 令 昌 。 


test = Ei.addr rel.op E>».addr 


s = if B.true £ fall and B.false # fall then 
gen('if' test ‘goto! B.true) || gen(‘goto’ B. false) 
else if B.true F fall then gen('if' test ’goto' B.true) 


else if B.false £ fall then gen('ifFalse’ test ‘goto’ B.false) 
else '' 


B.code = Ey.code || Ez.code || s 





图 6-39 BEF, rel E, 的 语义 规则 
在 图 6-40 中 显示 的 BB, | B, 的 新 规 
则 中 , 请 注意 B H fall 标号 和 B, 的 fall 标号 nei " Praia F fall then B.true else newlabel() 
RASARE, Æ B. true 为 fall, 即 如 果 | B, true = B.true 
B 为 真 时 控制 流 穿越 B。 虽 然 当 B 为 真 时 B | B2Salse = B.false 
B.code = if B.true # fall then By.code || Bo.cod 
的 值 必然 为 真 ,但 Bi true 必须 保证 控制 流 忠 | T HB tone 2 fell then fy code || Bs-code 


We WKB, ERIA B 之 后 的 下 一 条 
指令 。 图 6-40 BB, || B, 的 语义 规则 


男 一 方面 , 如 果 B, 的 值 为 假 , B 的 真 假 值 就 由 B 的 值 决 定 。 因 此 , 图 6-40 中 的 规则 保证 








O EC Al Java H, 表达 式 中 可 能 包含 赋值 语句 , 因此 即使 B. true 和 B. false 都 为 fall, 也 必须 为 子 表达 式 El A E, E 
成 代码 。 如 果 必 要 , 无 用 代码 可 以 在 优化 阶段 被 清除 。 
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Bi. false 对 应 于 控制 流 穿越 B, 直接 到 达 By 的 代码 的 情况 。 
B>B &&B> 的 语义 规则 和 图 640 中 的 语义 规则 类 似 , 我 们 将 其 留 作 练习 。 





OER (ETERS fall 的 语义 规则 将 例 6. 21 中 if x < 100 goto Ly 
ifFalse x > 200 goto Li 
的 程序 (6. a ifFalse x != y goto Lı 
if (x<100 || x>200 && x! =y ) x=0; Say Basie 
翻译 成 图 6-41 所 示 的 代码 。 





和 例 6. 22 一 样 , 产生 式 PS 的 语义 规则 创建 标号 
Lio ABI 6. 22 不 同 的 是 ， 当 应 用 BB, || B 的 语义 规则 
时 , 继承 属性 B. true 是 fall(B. false J L,). BI 6-40 中 的 
规则 创建 一 个 新 标号 L, 使 得 当 Bj 为 真 时 有 一 个 跳 转 指令 可 以 跳 过 B 的 代码 。 因 此 , By. true 
H L, Wi B,. false H fall, 因为 B 为 假 时 必须 计算 B, 的 值 。 

当 开 始 处 理 生 成 了 表达 式 * < 100 的 产生 式 BE, rel E, WY, B. true = L3 E B. false = fall, KI 
6-39 中 的 规则 使 用 这 些 继承 到 的 标号 生成 了 一 条 指令 if x<100 goto La。 O 
6.6.6 布尔 值 和 跳 转 代码 

环节 讨论 的 重点 是 用 于 改变 语句 中 控制 流 的 布尔 表达 式 。 一 个 布尔 表达 式 的 目的 可 能 就 是 
要 求 出 它 的 值 , 如 x =true; 或 x=a<b; 的 语句 中 的 布尔 表达 式 就 是 这 样 。 

处 理 布尔 表达 式 的 这 两 种 角色 的 一 种 简单 思路 是 首先 建立 表达 式 的 抽象 语法 树 ,可 以 使 用 下 
面 的 两 种 方法 之 一 : 

1) 使 用 两 趟 处 理 的 方法 。 为 输入 构造 出 完整 的 抽象 语法 树 ， 然 后 以 深度 优先 顺序 遍历 这 棵 
抽象 语法 树 , 依据 语义 规则 的 描述 计算 得 到 翻译 结果 。 

2) 对 语句 进行 一 赵 处 理 , 但 对 表达 式 进行 两 趟 处 理 。 使 用 这 种 方法 时 , 我 们 将 首先 翻译 语 
‘aj while(E) S, 中 的 ,然后 再 处 理 $; 。 然 而 , 要 对 五 进 行 翻译 , 需要 首先 建立 它 的 抽象 语法 树 ， 
然后 再 遍历 它 。 

在 下 列 文法 中 , 用 单个 非 终 结 符号 忆 来 代表 表达 式 : 

Sid =E; | if (E) S | while (E)SISS 
E>E || E | E&&E | Erel E | E+E | (E) | id | true | false 

非 终结 符号 互 支配 了 Swhile (E) 51 的 控制 流 。 同 一 个 非 终结 符号 五 在 Sid =E FEE + 
E 中 则 表示 一 个 值 。 

我 们 可 以 使 用 不 同 的 代码 生成 函数 处 理 表 达 式 的 这 两 种 角色 。 假 定 属性 E. n 表示 对 应 于 表达 
式 丈 的 抽象 语法 树 结 点 , 并 且 抽象 语法 树 中 的 结 点 都 是 对 象 。 念 方法 jump 产生 一 个 表达 式 结 点 的 
跳 转 代码 , 并 令 方 法 rvalue 产生 计算 结 点 的 值 的 代码 , 该 代码 还 把 得 到 的 值 存储 在 一 个 临时 变量 中 。 

对 于 出 现在 S->while (E) S, PRE, E2 E. n 上 调用 方法 jurmp。 方 法 jump 的 实现 是 基于 
图 6-37 给 出 的 关于 布尔 表达 式 的 语义 规则 。 确 切 地 说 , 跳 转 代码 是 通过 调用 E.n. jump, 万 生成 
的 ,其 中 上 是 指向 51. code 的 第 一 条 指令 的 新 标号 ， 而 上 就 


图 6-41 使 用 控制 流 穿越 
技术 翻译 的 主语 句 


是 标号 S. next, ifFalse a < b goto Lı 
对 于 出 现在 Sid = E; HHE, EAA E. n 上 调用 方 ifFalse c. < digoto Li 
法 realue, WILE FEW E, + Ey, 方法 调用 E. n. rvalue( ) 按 Sasi 


AA 6.4 PRC MTT IEA tS. WR EGU E &&E,, : t= false 
我 们 首先 为 E 生成 跳 转 代 码 , 然后 在 跳 转 代 码 的 真 假 出 口 2 

分 别 将 true 和 false 赋 给 一 个 新 的 临时 变量 t。 eee ee 
代码 来 实现 。 
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6.6.7 6.6 节 的 练习 

练习 6. 6. 1: 在 图 6-36 的 语法 制导 定义 中 添加 处 理 下 
列 控制 流 构造 的 规则 : 

1) 一 个 repeat 语句 , repeat S while B, 

t2) 一 个 for 循环 语句 ， for (S,; B; So "S46 

练习 6. 6.2; 现代 计算 机 试图 在 同一 时 刻 执行 多 条 指令 , 其 中 包括 各 种 分 支 指令 。 因 此 ， 当 
计算 机 投机 性 地 预先 执行 某 个 分 支 , 但 实际 控制 流 却 进 入 另 一 分 支 时 (此 时 所 有 预先 执行 的 投机 
工作 将 被 抛弃 ) ,付出 的 代价 是 很 大 的 。 因 此 我 们 希望 尽 可 能 地 减少 分 支 数量 。 请 注意 ,在 
图 6.35e 中 while 循环 语句 的 实现 中 , 每 个 迭代 有 两 个 分 支 : 一 个 是 从 条 件 B 进入 到 循环 体 中 , 另 
一 个 分 支 跳 转 回 B 的 代码 。 基 于 尽量 减少 分 支 的 考虑 ,我 们 通常 更 倾向 于 将 while(B) S 当 作 
if (B) {repeat Suntil | (B) | 来 实现 。 给 出 这 种 翻译 方法 的 代码 布局 , 并 修改 图 6-36 中 while f 
环 语句 的 规则 。 

| 练习 6.6.3: 假设 C 中 存在 一 个 异 或 运算 ( 当 且 仅 当 两 个 分 量 恰 有 一 个 为 真 时 ,表达 式 为 
真 ) 。 按 照 图 6-37 的 风格 写 出 这 个 运算 符 的 代码 生成 规则 。 

练习 6. 6.4: 使 用 6.6.5 节 中 介绍 的 避免 goto 语句 的 翻译 方案 , 翻译 下 列表 达 式 ;: 

1) if (a==b && c==d || e==f) x == 1; 

2) if (a=b The==alll eset) x == 15 

3) if (a==b && c==d && e==f) x == 1; 

练习 6.6.5: 基于 图 6-36 和 图 6-37 中 给 出 的 语法 制导 定义 , 给 出 一 个 翻译 方案 。 

练习 6. 6. 6: 使 用 类 似 于 图 6-39 和 图 640 中 的 规则 ， 修改 图 6-36 和 图 6-37 的 语义 规则 , 使 
之 允许 控制 流 穿越 。 

| 练习 6. 6.7: 练习 6. 6.6 中 的 语句 的 语义 规则 产生 了 一 些 不 必要 的 标号 。 修 改 图 6-36 中 语 
句 的 规则 , 使 之 只 创建 必要 的 标号 。 你 可 以 使 用 特殊 标号 deferred 来 表示 还 没有 创建 一 个 标号 。 
你 的 语义 规则 必须 能 够 生成 类 似 于 例 6. 21 的 代码 。 

n 练习 6. 6. 8: 6. 6.5 节 中 讨论 了 如 何 使 用 穿越 代码 来 尽 可 能 减少 生成 的 中 间 代 码 中 跳 转 
指令 的 数目 。 然 而 , 它 并 没有 充分 考虑 将 一 个 条 件 蔡 换 为 它 的 补 的 方法 ,例如 将 if a < P goto 
Li; goto Ly; 替换 为 if a >=b goto Lz; goto Li 。 给 出 一 个 语法 制导 定义 ， 它 在 需要 时 可 以 
利用 这 种 替换 方法 。 


6.7 回填 


为 布尔 表达 式 和 控制 流 语句 生成 目标 代码 时 , 关键 问题 之 一 是 将 一 个 跳 转 指令 和 该 指令 的 
目标 匹配 起 来 。 例 如 , 对 if (B) $ 中 的 布尔 表达 式 B 的 翻译 结果 中 包含 一 条 跳 转 指 令 。 当 B 为 
假 时 , 该 指令 将 跳 转 到 紧 跟 在 5 的 代码 之 后 的 指令 处 。 在 一 趟 式 的 翻译 中 , B 必须 在 处 理 S 之 前 
就 翻译 完毕 。 那 么 跳 过 5 的 goto 指令 的 目标 是 什么 呢 ? 在 6.6 节 中 , 我 们 解决 这 个 问题 的 方法 
是 将 标号 作为 继承 属性 传递 到 生成 相关 跳 转 指令 的 地 方 。 但 是 , 这 样 的 做 法 要 求 再 进行 一 趟 处 
H, 将 标号 和 具体 地 址 绑 定 起 来 。 

本 节 将 介绍 一 种 被 称 为 回填 (backpatching) 的 补充 性 技术 , 它 把 一 个 由 跳 转 指令 组 成 的 列表 
以 综合 属性 的 形式 进行 传递 。 明确 地 讲 , 生成 一 个 跳 转 指 令 时 暂时 不 指定 该 跳 转 指 令 的 目标 。 
这 样 的 指令 都 被 放 入 一 个 由 跳 转 指令 组 成 的 列表 中 。 等 到 能 够 确定 正确 的 目标 标号 时 才 去 填充 
这 些 指令 的 目标 标号 。 同 一 个 列表 中 的 所 有 跳 转 指令 具有 相同 的 目标 标号 。 

6.7.1 使 用 回填 技术 的 一 趟 式 目 标 代码 生成 
回填 技术 可 以 用 来 在 一 趟 扫描 中 完成 对 布尔 表达 式 或 控制 流 语句 的 目标 代码 生成 。 我 们 生 
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成 的 目标 代码 的 形式 和 6. 6 节 中 的 代码 的 形式 相同 , 但 是 处 理 标 号 的 方法 不 同 。 

在 本 节 中 , 非 终结 符号 B 的 综合 属性 truelist 和 falselist 将 用 来 管理 布尔 表达 式 的 跳 转 代码 中 
的 标号 。 特 别 的 ，B. truelist 将 是 一 个 包含 跳 转 或 条 件 跳 转 指令 的 列表 , 我 们 必须 向 这 些 指令 中 插 
入 适当 的 标号 , 也 就 是 当 B 为 真 时 控制 流 应 该 转向 的 标号 。 类 似 地 , B. falselist 也 是 一 个 包含 跳 
转 指令 的 列表 , 这 些 指 令 最 终 获得 的 标号 就 是 当 为 假 时 控制 流 应 该 转向 的 标号 。 在 生成 B 的 
代码 时 ， 跳 转 到 真 或 假 出 口 的 跳 转 指令 是 不 完整 的 ,标号 字段 尚未 填写 。 这 些 不 完整 的 跳 转 指令 
被 保存 在 B. truelist 和 B. falselist 所 指 的 列表 中 。 类 似 地 , 语句 5 的 综合 属性 S. nextlist 也 是 一 个 跳 
转 指 令 列 表 , 这 些 指令 应 该 跳 转 到 紧 跟 在 $ 的 代码 之 后 的 指令 。 

更 明确 地 讲 , 我 们 将 生成 的 指令 放 入 一 个 指令 数组 中 , 而 标号 就 是 这 个 数组 的 下 标 。 为 了 处 
理 跳 转 指令 的 列表 , 我 们 使 用 下 面 三 个 函数 : 

1) makelist(i) 创 建 一 个 只 包含 i 的 列表 。 这 里 i 是 指令 数组 的 下 标 。 函 数 makelist 返回 一 个 
指向 新 创建 的 列表 的 指针 。 

2) merge(p,, ps) 将 pi M p 指向 的 列表 进行 合并 , 它 返 回 的 指针 指向 合并 后 的 列表 。 

3) backpatch(p, i) 将 i 作为 目标 标号 插入 到 p 所 指 列表 中 的 各 指令 中 。 
6.7.2 布尔 表达 式 的 回填 

现在 我 们 构造 一 个 可 以 在 自 底 向 上 语法 分 析 过 程 中 为 布尔 表达 式 生成 目标 代码 的 翻译 方案 。 
这 个 文法 中 有 一 个 标记 非 终 结 符号 M。 它 引发 的 语义 动作 在 适当 的 时 刻 获取 将 要 生成 的 下 一 条 
指令 的 下 标 。 该 文法 如 下 : 


B > BillMB»|B: && M Bz |! Bı |.(Bı) | E: rel Ez | true | false 
Mye 


翻译 方案 如 图 6-43 所 示 。 


B= Br W M B: { backpatch(B, .falselist, M.instr); 
B.truelist = merge( B: .truelist, By.truelist); 
B.falselist = By. falselist; } 


B > Bı && MB { backpatch(B,.truelist, M.instr); 
B.truelist = By.truelist; 
B. falselist = merge(B, .falselist, By .falselist); } 
B> !B, { B.truelist = B,.falselist; 
B.falselist = B,.truelist; } 


B-(B,) { B.truelist = B,.truelist; 
B.falselist = B,.falselist; } 


B- E; rel E { B.truelist = makelist(nextinstr); 
B.falselist = makelist(nextinstr + 1); 
gen ('if' Ei.addr rel.op Ey.addr 'goto -'); 
gen (‘goto _'); } 
{ B.truelist = makelist(nextinstr); 
gen('goto -);} 


{ B.falselist = makelist(neztinstr); 
gen (‘goto _'); } 


{ M.instr = neztinstr; } 





图 6-43 布尔 表达 式 的 翻译 方案 
考虑 上 述 文法 中 对 应 于 规则 BB, || MB, 的 语义 动作 (1)。 如 果 已 为 真 , 那么 B 也 为 真 , 这 
FF By. truelist 中 的 跳 转 指令 就 成 为 B. truelist 的 一 部 分 。 然 而 , 如 果 Bi AK, 我 们 下 一 步 必须 测 
W By. litt By. falselist 中 的 跳 转 指 令 的 目标 必定 是 B 的 代码 的 起 始 位 置 。 这 个 位 置 使 用 标记 非 
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终结 符号 M 获 得。 在 即将 生成 B 代码 之 前 , 放生 成 了 下 一 条 指令 的 序号 , 存放 在 综合 属性 
M. instr 中 。 

为 了 获得 指令 序号 , 我 们 将 产生 式 Me 和 语义 动作 

| M. instr = nextinstr; | 

关联 起 来 。 变 量 nextinstr 保存 了 紧 跟 着 的 下 一 条 指令 的 序号 。 当 我 们 已 经 看 到 了 产生 式 
B 一 Bi || M B, 的 余下 部 分 时 , 这 个 值 将 被 回填 到 B. falselist 中 的 指令 上 ( 即 B]. falselist 中 的 每 条 
指令 都 把 M. instr 当 作 目标 标号 ) o 

BB, && M B, 的 语义 动作 (2) 和 动作 (1) 类 似 。B 一 18 的 语义 动作 (3 ) 对 换 真 假 列 表 。 动 
作 (4) 只 是 忽略 括号 。 

为 简单 起 见 , 语义 动作 (5 ) 生成 了 两 条 指令 : 一 个 条 件 转移 指令 goto 和 一 个 无 条 件 转移 指 
令 。 它 们 的 目标 标号 都 未 填写 。 这 两 个 指令 被 放 入 新 的 分 别 由 B. truelist 和 B. falselist 指向 的 列 
表 中 。 
再 次 考虑 表达 式 


z < 100 I| zr >200&&zr!= y 
它 的 一 棵 注释 语法 分 析 树 如 图 6-44 所 示 。 为 了 增加 可 读 性 , 属性 truelist , falselist 和 instr 分 别 用 
它们 的 第 一 个 字母 表示 。 在 对 这 棵 语法 树 进行 深度 优先 遍历 时 执行 语义 动作 。 因 为 所 有 的 动作 
都 出 现在 规则 右 部 的 最 后 , 因此 它们 可 以 和 自 底 向 上 语法 分 析 过 程 中 的 归 约 动作 同时 进行 。 在 
根据 产生 式 (5) 将 *<100 归 约 为 B 时 , 语义 动作 相应 地 产生 两 条 指令 : 


100: If x < fOO goto - 
10l; goto 


我 们 任意 地 从 100 开始 为 指令 编号 。 产 生 式 

B > B,\|M Bz 
中 的 标记 非 终结 符号 MM 记录 了 nextinstr 的 值 ,此 时 这 个 值 为 102。 使 用 产生 式 (5) 将 x > 200 归 约 
为 8 产生 下 面 两 条 指令 


102: if x > 200 gotoue 
103: goto _ 


FRA « > 200 对 应 于 下 面 产 生 式 中 的 By: 

B+ Bı && M B; 
标记 非 终结 符号 MRT nextinstr 的 当前 值 , 现在 是 104。 使 用 产生 式 (5) 将 x1 =y BAH B 
生 下 列 指令 


104: if x != y goto _ 
105: goto = 


B.t = {100, 104} 
B.f = {103, 105} 


Bad / A aia 


B.t = {100} | B.t = {104} 
B.f = {101} B.f = {103, 105} 
NE x N i 
Fil Re get pati 
Bt = {102} | B.t = {104} 
B.f = {103} A B.f = {105} 
MAN AVN 
x > 200 že t= ly 


图 6-44 x<100 || x>200 && x! =y 的 注释 语法 分 析 树 
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我 们 现在 使 用 BB, &&M B, 进行 归 约 。 相 应 的 语义 动作 调用 backpatch (Bi. truelist, M. instr) 


将 Bi 的 真 值 出 口 绑 定 到 By 的 第 一 条 指令 处 。 因 为 
B,. truelist 是 |1021 , M. instr $104, 这 次 对 backpatch 的 调 
用 将 序号 104 填写 到 102 指令 中 。 至 今 为 止 产 生 的 六 条 
指令 如 图 6-45a 所 示 。 

和 最 后 一 次 归 约 使 用 的 产生 式 B—B || M B, 相关 联 
的 语义 动作 调用 backpatch( {101}, 102), 得 到 的 指令 如 
图 6-45b 所 示 。 

整个 表达 式 为 真 当 且 仅 当 控制 流 到 达 100 和 104 位 
置 上 的 跳 转 指 令 ; 表达 式 为 假 当 且 仅 当 控 制 流 到 达 103 和 
105 位 置 上 的 跳 转 指 令 。 在 后 续 的 编译 过 程 中 ， 当 已 知 表 
达 式 为 真 或 假 时 分 别 应 该 做 什么 的 时 候 , 这 些 指令 的 目 
标 将 会 被 填写 完整 。 E 








if x < 100 goto _ 
"OTO = 
if x > 200 goto 104 


< (Ob 


2G. 0h) goto- 


t BOGO 





a) 将 104 回填 到 指令 102 中 之 后 


if x < 100 goto l 


: goto 102 


if x > 200 goto 104 


> gota 
if x != y goto . 
: goto _ 





6.7.3 控制 转移 语句 b) 将 102 回填 到 指令 101 中 之 后 

现在 我 们 使 用 回填 技术 在 一 趟 扫描 中 完成 控制 流 语 图 6-45 回填 的 步 又 
名 的 翻译 。 考 虑 由 下 列 文法 产生 的 语句 ， 

S > if(B)S | if(B)S else S$ | while(B)S ob Fl Ae 
五 =>) Disc is 

这 里 $ 表示 一 个 语句 ,了 是 一 个 语句 的 列表 , 4 是 一 个 赋值 语句 ，B8 是 一 个 布尔 表达 式 。 请 注意 ， 
一 定 还 存在 一 些 其 他 的 产生 式 ， 比 如 那些 关于 赋值 语句 的 产生 式 。 然 而 , 这 里 给 出 的 这 些 产生 式 
已 经 足以 用 来 说 明 在 控制 流 语句 的 翻译 中 用 到 的 技术 。 

语句 过、if-else 和 while 的 代码 布局 和 6.6 节 中 的 描述 一 样 。 我 们 给 出 一 个 隐 含 的 假设 , 即 指 
令 数 组 中 的 代码 顺序 反映 了 控制 流 的 自然 流动 , 即 控制 从 一 条 语句 到 达 下 一 条 语句 。 假 如 没有 
这 个 假设 , 那么 我 们 就 必须 明确 插入 跳 转 指令 来 实现 自然 的 顺序 控制 流 。 

图 6-46 中 的 翻译 方案 保留 了 多 个 跳 转 指令 的 列表 ， 当 确定 了 这 些 跳 转 指令 的 目 标 序 号 后 就 
会 回填 列表 。 如 图 6-43 所 示 , 由 非 终 结 符号 B 生成 的 布尔 表达 式 有 两 个 跳 转 指令 列表 : B. truelist 
和 B. falselist。 它 们 分 别 对 应 于 B 的 代码 的 真 假 出 口 。 由 非 终 结 符号 5 和 工 生 成 的 语句 也 有 一 个 
待 回 填 的 跳 转 指令 列表 ,由 属性 nextlist 表示 。 列 表 S. nextlist 中 包含 了 所 有 跳 转 到 按照 运行 顺序 
紧 跟 在 S 代码 之 后 的 指令 的 条 件 或 无 条 件 转移 指令 。 nextlist 的 定义 与 此 类 似 。 

考虑 图 6-46 中 的 语义 动作 (3) 。 产 生 式 S—while (B) S, 的 代码 布局 如 图 6-35c 所 示 。 标记 
非 终结 符号 M 在 产生 式 

S—while M, (B) M, S; 

中 的 两 次 出 现 分 别 记录 了 B 的 代码 和 51 的 代码 的 开始 处 的 指令 编号 。 它 们 分 别 对 应 于 图 6-35e 
中 的 标号 begin 和 B. true, 

MM 还 是 只 有 了 唯一 的 产生 式 Me, 图 6-46 中 的 动作 (6) 将 属性 M. inser 的 值 设 为 下 一 条 指令 
的 序号 。 在 while 语句 的 循环 体 S, 执行 之 后 , 控制 流 回 到 此 语句 的 起 始 位 置 。 因此 , 在 将 while 
M,(B) M, Si 归 约 为 5 的 时 候 , 我 们 对 S1. nextlist 中 的 所 有 跳 转 指令 进行 回填 , 使 得 该 列表 中 所 
有 指令 的 目标 为 序号 M. instr, F S; 的 代码 之 后 显 式 地 插入 了 一 条 跳 转 到 B 的 代码 的 开始 处 的 
指令 , 这 是 因为 控制 流 也 有 可 能 “穿越 底部 ”。 通 过 将 B. truelist 中 的 指令 设置 为 转向 M. instr, 我 
们 将 B. truelist 回填 为 S, 代码 的 起 始 位 置 。 

FEA AEE if(B) Si else S, 生成 代码 时 , 我 们 可 以 看 到 更 加 有 说 服 力 的 使 用 S. nextlist 和 
L. nextlist 的 理由 。 如 果 控 制 流 “ 穿 越 * 了 5) 的 代码 的 底部 , 比如 当 Si 是 一 个 赋值 语句 时 就 会 发 生 
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这 样 的 事情 , 我 们 必须 在 1 的 代码 之 后 增加 一 条 越过 S 代码 的 跳 转 指令 。 我 们 使 用 位 于 S 之 
后 的 另 一 个 标记 非 终结 符号 来 生成 这 个 跳 转 指令 。 假 定 这 个 标记 非 终 结 符号 为 N, 且 其 产生 式 为 
N>e, N 有 属性 N. nextlist, 它 是 一 个 由 NN 的 语义 动作 (7) 生 成 的 跳 转 指令 goto .的 序号 组 成 的 
列表 。 
















1) S > if(B) M S, { backpatch(B.truelist, M.instr); 
S.nestlist = merge(B.falselist, S;.neatlist); } 


2) SS WCB) Mi Sı N else Mo S> 
{ backpatch(B.truelist, Mı instr); 
backpatch(B.falselist, M2.instr); 
temp = merge(S;.neztlist, N.neztlist); 
S.neztlist = merge(temp, S2.nectlist); } 





3) S— while Mı (B) MS! 
{ backpatch(S;.nextlist, My .instr); 
backpatch(B.truelist, M2.instr); 
S.neztlist = B.falselist; 
gen('goto’ M,.instr); } 


4) S> L} { S.neztlist = L.neztlist; } 

5) S >A; { S.neztlist = null; } 

6) Me { M.instr = nextinstr, } 

7) NE { N.nextlist = makelist(neztinstr); 
gen('goto -'); } 


8) Loli MS { backpatch(L; .nextlist, M.instr); 
L.nestlist = S.nectlist; } 


9) LoS { L.neatlist = S.neztlist; } 





图 6-46 语句 的 翻译 


图 6-46 中 的 语义 动作 (2) 处 理 满足 下 列 语法 的 if-else 语句 : 
S—if (B) M, S, N else M, S, 

我 们 将 对 应 于 B 为 真 的 跳 转 指令 回填 为 M1. instr, 也 就 是 S, 的 代码 的 开始 位 置 。 类 似 地 , 我 
们 将 回填 那些 对 应 于 B 为 假 的 跳 转 指令 , 使 它们 跳 转 到 S, 的 代码 的 开始 位 置 。 列 表 S. nextlist 包 
含 了 所 有 从 S, 和 $ 中 跳出 的 指令 , 也 包括 由 NV 产生 的 跳 转 指 令 。( 变量 temp 是 仅 用 于 合并 列表 
的 临时 变量 。) 

语义 动作 (8) 和 (9) 处 理 语 名 序列。 在 

L—>L, M S 
中 , 按照 执行 顺序 紧 跟 在 L, 的 代码 之 后 的 是 $ 的 开始 指令 。 因 此 , FUR L. nextlist 被 回填 为 3 代 
码 的 开始 位 置 , 该 位 置 由 M. instr 给 出 。 在 LS, L. nextlist Ail S. nextlist 相同 。 

请 注意 , 除了 语义 规则 (3) 和 (7) 之 外 ;, 这 些 语 义 规则 中 的 任何 地 方 都 没有 产生 新 的 指令 。 
其 他 所 有 的 代码 都 是 由 赋值 语句 和 表达 式 相 关 的 语义 动作 产生 的 。 我 们 根据 控制 流 进行 了 正确 
的 回填 , 因此 赋值 语句 和 布尔 表达 式 的 求 值 过 程 被 正确 地 连接 了 起 来 。 

6.7.4 break 语句 、continue 语句 和 goto 语句 i 
用 于 改变 程序 控制 流 的 最 基本 的 程序 设计 语言 结构 是 goto 语句 。 在 C 语言 中 , f goto LIX 
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样 的 语句 将 控制 流转 到 标号 为 工 的 指令 一 一 在 相应 作用 域内 必须 恰好 存在 一 条 标号 为 工 的 语句 。 
在 实现 goto 语句 时 , 可 以 为 每 个 标号 维护 一 个 未 完成 跳 转 指令 的 列表 , 然后 在 知道 这 些 指 令 的 目 
标 之 后 进行 回填 。 

Java 废除 了 goto 语句 。 但 是 Java 支持 一 种 规范 化 的 跳 转 语 句 ， 即 break 语句 。 它 使 控制 流 跳 
出 外 围 的 语言 结构 。jJava 中 还 可 以 使 用 continue 语句 。 这 个 语句 的 作用 是 触发 外 围 循环 的 下 一 轮 
迭代 。 下 面 的 代码 摘自 一 个 语法 分 析 器 , 它 说 明了 简单 的 break 语句 和 continue 语句 。 


1) for ( ; 5 readchO®) ) 4 

2) if( peek == ’ ? || peek == ’\t’ ) continue; 
3) else if( peek == ’\n’ ) line = line + 1; 

4) else break; 

ju 


控制 流 会 从 第 4 行 中 的 break 语句 跳出 到 外 围 for- 循 环 之 后 的 下 一 个 语句 。 控 制 流 也 会 从 第 
2 行 中 的 continue 语句 跳 转 到 计算 reach() 的 代码 ， 然 后 再 转 到 第 2 行 中 的 并 语 句 。 

如 果 S 表示 外 围 的 循环 结构 , 那么 一 条 break 语句 就 是 跳 转 到 $ 代码 之 后 第 一 条 指令 处 的 跳 转 
指令 。 我 们 可 以 按照 下 面 的 步骤 为 break 生成 代码 : @) 跟 踪 外 围 循环 语句 S, DHIA break 语句 生成 
未 完成 的 跳 转 指 令 , @) 将 这 些 指令 放 到 S. nextlist P, 其 中 nextlist 就 是 6.7.3 节 中 讨论 的 列表 。 

在 一 个 通过 两 趟 扫描 构建 抽象 语法 树 的 编译 器 前 端 中 ，S. nextlist 可 以 被 实现 为 对 应 于 语句 S 
的 结 点 的 一 个 字段 。 我 们 可 以 在 符号 表 中 将 一 个 特殊 的 标识 符 break 映射 为 表示 外 围 循环 语句 S 
的 结 点 , 以 此 来 跟踪 5。 这 种 方法 同样 可 以 处 理 java 中 带 标号 的 break 语句 , 因为 同样 可 以 用 符 
号 表 来 将 这 个 标号 映射 为 对 应 于 标号 所 指 的 结构 的 语法 树 结 点 。 

如 果 不 使 用 符号 表 来 访问 5 的 结 点 , 我 们 还 可 以 在 符号 表 中 设置 一 个 指向 S. nextlist 的 指针 。 
现在 当 遇 到 一 个 break 语句 时 , 我 们 生成 一 个 未 完成 的 跳 转 指 令 , 并 通过 符号 表 查 找到 nextlist， 
然后 把 这 个 跳 转 指令 加 入 到 这 个 列表 中 。 这 个 nextlist 将 按照 6.7.3 节 中 讨论 的 方法 进行 回填 。 

continue 语句 的 处 理 方法 和 break 语句 的 处 理 方法 类 似 。 两 者 之 间 的 主要 区 别 在 于 生成 的 跳 
转 指 令 的 目标 不 同 。 

6.7.5 6.7 节 的 练习 

练习 6. 7. 1: 使 用 图 643 中 的 翻译 方案 翻译 下 列表 达 式 。 给 出 每 个 子 表达 式 的 truelist 和 
falselist。 你 可 以 假设 第 一 条 被 生成 的 指令 的 地 址 是 100。 

1) a==b && (c==d || e==f) 

2) (a==b || c==d) || e==f 

3) (a==b && c==d) && e==f 

练习 6.7.2: 图 6-47a 中 给 出 了 一 个 程序 的 摘要 。6-47b 概述 了 使 用 图 6-46 中 的 回填 翻译 方 
案 生成 的 三 地 址 代码 的 结构 。 这 里 , i ~ig 是 每 个 code 区 域 的 第 一 条 被 生成 指令 的 标号 。 当 我 
们 实现 这 个 翻译 时 , 我 们 为 每 个 布尔 表达 式 维护 了 两 个 列表 , 表 中 给 出 EE 的 代码 中 的 一 些 位 
置 。 我 们 分 别 用 E. true 和 E. false 来 表示 这 两 个 列表 。 对 于 E. true 列表 中 的 那些 指令 位 置 , 我 们 
最 终 要 加 入 当 记 为 真 时 控制 流 应 该 到 达 的 语句 的 标号 。E. false 是 类 似 的 存放 特定 位 置 号 的 列表 ， 
我 们 要 在 这 些 位 置 上 加 入 当 发 现 E 为 假 时 控制 流 应 该 到 达 的 标号 。 同 时 , 我 们 还 为 语句 8 维护 
了 一 个 位 置 的 列表 。 我 们 必须 在 这 些 位 置 上 加 入 当 5 执行 完毕 之 后 控制 流 应 该 到 达 的 标号 。 请 
给 出 最 终 将 代替 下 列 各 个 列表 中 的 位 置 的 值 ( 即 立 ~ ig 中 的 某 个 标号 ) 。 

(1) Ez. false (2) Sy. next (3) Ey. false (4) Si next (5) E,. true 

练习 6.7.3: 当 使 用 图 6-46 中 的 翻译 方案 对 图 6-47 进行 翻译 时 , 我 们 为 每 条 语句 创建 
S. next 列表 。 一 开始 是 赋值 语句 Si S2 S3, 然后 逐步 处 理 越 来 越 大 的 站 语句 、if-else 语句 、while 
语句 和 语句 块 。 在 图 6-47 中 有 5 个 这 种 类 型 的 结构 语句 : 

S4: while( E3) Sjo 
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Ss: if( Eb,) Soo 
Se: 包含 5; AS; 的 语句 块 。 


Sg : 整个 程序 。 
i): Code for Ey 
i2: Code for Es 
i3: Code for Ey 
-时 i4: Code for Sı 


else { is: Code for E4 


if (Ea) 


ig: Code for Sy 


2; iz; Code for S3 





b) 
图 6-47 练习 6.7.2 的 程序 的 控制 流 结构 


对 于 这 些 结构 语句 , 我 们 可 以 通过 一 个 规则 用 其 他 的 Sj. next 列表 以 及 程序 中 的 表达 式 的 列 
KR Ep true 和 Ep. false 构造 出 S; next. 给 出 计算 下 列 next 列表 的 规则 : 
(1) Sy. next (2) Ss. next (3) Sg. next (4) S7. next (5) Sg. next 


6.8 switch 语句 


很 多 语言 都 使 用 “switch” 或 “case” 语 句 。 我 们 的 switch 语句 的 语法 如 图 6-48 所 示 。 语 句 中 包 
含 一 个 待 求 值 的 选择 表达 式 E, 后 面 是 该 表达 式 可 能 取 的 nn 个 党 EET P 
量 值 Vi, Vase, Vio WAHE AEA — ARA”, 4A ABE V Si 
值 都 不 和 选择 表达 式 的 值 匹配 时 ， 就 用 这 个 默认 值 来 匹配 。 case Vz: S> 
6.8.1 switch 语句 的 翻译 ET i S 

一 个 switch 语句 的 预期 翻译 结果 是 完成 如 下 工作 的 代码 : default: Sn 

1) WAEREA E 的 值 。 

2) 在 case 列表 中 寻找 与 表达 式 值 相同 的 值 VW。 回 顾 一 下 ， ”图 6-48 Switch 语句 的 语法 
当 在 case 列表 中 明确 列 出 的 值 都 不 和 表达 式 匹配 时 , 就 用 默认 值 和 表达 式 匹配 。 

3) 执行 和 匹配 值 关联 的 语句 5;。 

步骤 (2) 是 一 个 路 分 支 , 它 可 以 采取 多 种 方法 实现 。 如 果 case 的 数目 较 少 ,比如 不 多 于 10 
个 ,那么 可 以 使 用 一 个 条 件 跳 转 指令 序列 来 实现 。 每 一 个 条 件 跳 转 指令 都 测试 一 个 常量 值 ， 并 跳 
转 到 这 个 值 对 应 的 语句 的 代码 。 

实现 这 个 条 件 跳 转 指 令 序列 的 一 个 简洁 的 方法 是 创建 一 个 对 照 关系 表 。 表 中 的 每 一 个 关系 
都 包含 了 一 个 常量 值 和 相应 语句 代码 的 标号 。 在 运行 时 刻 , 表达 式 自 身 的 值 以 及 默认 语 旬 的 标 
号 被 放 在 对 照 表 的 未 端 。 编 译 器 生成 一 个 简单 循环 ， 把 表达 式 的 值 和 表 中 的 每 个 值 进行 比较 。 
我 们 已 经 保证 了 当 找 不 到 其 他 匹配 时 , 最 后 一 个 条 目 (默认 值 条 目 ) 一 定 会 匹配 。 

如 果 值 的 个 数 超过 10 个 或 更 多 ， 那么 更 高 效 的 方式 是 为 这 些 值 构造 一 个 散 列 表 。 这 个 表 的 
条 目 是 各 个 分 支 语句 的 标号 。 如 果 没 有 找到 对 应 于 switch 表达 式 的 值 的 条 目 ， 就 会 有 一 条 跳 转 指 
令 转 到 默认 语句 。 

还 有 一 种 常见 的 特殊 情况 , 它 的 实现 可 以 比 n 路 分 支 更 加 高 效 。 如 果 表 达 式 的 值 位 于 某 个 
较 小 的 范围 内 ， 比 如 从 min 到 max, 并 且 不 同 常量 值 的 总 数 接近 max — min, 那么 我 们 可 以 构造 一 
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个 包含 max - min 个 “ 桶 ”的 数组 ， 其 中 桶 7 - min 包含 了 对 应 于 值 j 的 语句 的 标号 ; 任何 没有 被 填 
入 对 应 标号 的 “ 桶 ”中 包含 了 默认 标号 。 

执行 switch 语句 时 , 首先 计算 表达 式 并 获得 值 j; 检查 它 是 否 在 min 到 max 的 范围 之 内 , 如 是 
则 间接 跳 转 到 偏 移 量 为 - min 的 条 目 中 的 标号 。 例 如 ， 如 果 表 达 式 的 类 型 是 字符 型 , 我 们 可 以 创 
建 一 个 包含 128 个 条 目 (根据 具体 的 字符 集 , AB 个 数 可 有 不 同 ) 的 表 , 并 且 不 进行 范围 检查 直接 
进行 控制 流 跳 转 。 

6.8.2 switch 语句 的 语法 制导 翻译 

图 6-49 中 的 中 间 代 码 是 图 6-48 中 的 switch 语句 的 一 个 近似 翻译 结果 。 所 有 的 测试 都 出现 在 
代码 的 末端 ， 因此 一 个 简单 的 代码 生成 器 就 可 以 识别 出 多 路 分 支 ， 并 使 用 本 节 开 始 时 介绍 的 多 种 
实现 方法 中 最 合适 的 实现 方法 来 生成 高 效 的 代码 。 

图 6-50 中 显示 的 是 一 个 更 直接 的 代码 序列 。 它 要 求 编译 器 进行 更 加 深入 的 分 析 , 才能 找到 
最 高 效 的 实现 。 值 得 注意 的 是 , 在 一 趟 式 编译 器 中 ， 将 分 支 语句 放 在 开始 的 位 置 会 造成 不 便 , A 
为 编译 器 此 时 还 没有 碰 到 各 个 语句 5;， 无 法 生成 转向 各 个 语句 的 代码 。 

为 了 翻译 成 如 图 6-49 所 示 的 形式 ， 当 我 们 看 到 关键 字 switch 的 时 候 , 我 们 生成 两 个 新 标号 
test 和 next 以 及 一 个 临时 变量 1。 然后 ， 当 我 们 对 表达 式 E 进行 语法 分 析 的 时 候 , 生成 计算 一 
值 并 将 其 保存 到 ; 的 代码 。 处 理 完 正之 后 ， 产生 跳 转 指令 goto test。 

当 我 们 看 见 各 个 case 关键 字 时 ， 就 创建 一 个 新 的 标号 L;, 并 将 其 加 入 符号 表 。 我 们 将 在 一 
个 仅 用 于 存放 case 分 支 的 队列 中 放 入 一 个 值 -标号 对 。 这 个 值 - 标号 对 由 常量 值 大 和 户 ( 或 者 
是 指向 符号 表 中 工 ; 的 条 目的 指针 ) 组 成 。 我 们 逐个 处 理 语句 case Vi: S, 生成 附加 于 5; 的 代码 上 
的 标号 L;。 最 后 生成 跳 转 指令 goto next, 


code to evaluate E into t 
goto test 
code for Sı 
goto next 
code for S2 
goto next 


code to evaluate E into t 
if t t= Vi goto Li 
code for 5; 

goto next 

ift != VW goto L2 
code for S2 


code for Sn_1 

goto next 

code for Sr 

goto next 

if t = Vi goto Li 
if t = V2 goto L2 


goto next 


if t Y= Vp.1 goto Lnr- 
code for Sn_1 

goto next 

code for Sn 


if t= Vat goto jn 
goto Ln 





图 6-49 一 个 switch 语句 的 翻译 结果 图 6-50 ”一 个 switch 语句 的 另 一 种 翻译 
当 编 译 器 到 达 switeh 语句 的 未 端 时 ,我 们 已 经 可 以 生成 athe cat 
n 路 分 支 的 代码 了 。 读 取 值 -标号 对 的 队列 , 我 们 就 可 以 生 case t Vp Ly 
成 形 如 图 6-51 所 示 的 三 地 址 语句 序列 。 其 中 是 一 个 保存 选 
BIKR E 的 值 的 临时 变量 , La 为 默认 语句 的 标号 。 Ta lal 
指令 caset V; Li 和 图 6-49 PH) if t =V; goto L; F SAL 





义 相 同 , 但 是 case 指令 更 加 容易 被 最 终 的 代码 生成 器 探测 6-51 ”用 来 翻译 switch 语句 的 
a, 从 而 对 这 些 指令 进行 某 种 特殊 处 理 。 在 代码 生成 阶段 ， case 三 地 址 代码 指令 
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根据 分 支 的 个 数 以 及 这 些 值 是 否 在 一 个 较 小 的 范围 内 , 这 些 case 语句 的 序列 可 以 被 翻译 成 最 高 
效 的 nn 路 分 支 。 
6.8.3 6.8 节 的 练习 

| 练习 6. 8. 1: 为 将 switch 语句 翻译 成 一 个 如 图 6-51 所 示 的 case 语句 序列 , 翻译 器 需要 在 处 
BH switch 语句 的 源 代码 时 创建 一 个 由 值 - 标号 对 组 成 的 列表 。 我 们 可 以 使 用 一 个 附加 的 翻译 方 
案 来 做 到 这 一 点 , 这 个 方案 只 搜集 这 些 值 -标号 对 。 给 出 一 个 语法 制导 定义 的 概要 描述 。 该 
SDD 可 以 生成 值 -标号 对 照 表 , 同时 还 为 各 个 语句 S; 生成 代码 。 这 里 的 $; 是 各 个 case 对 应 的 
动作 。 
6.9 过程 的 中 间 代 码 


过 程 及 其 实现 将 在 第 7 章 中 与 运行 时 刻 的 变量 存储 管理 一 并 详细 地 讨论 。 本 节 我 们 使 用 术 
语 “函数 ”来 表示 带 有 返回 值 的 过 程 。 我 们 将 简单 讨论 函数 声明 以 及 函数 调用 的 三 地 址 代码 。 在 
三 地 址 代码 中 ,函数 调用 被 拆 分 为 准备 进行 调用 时 的 参数 求 值 ， 然后 是 调用 本 身 。 为 简单 起 见 ， 
我 们 假定 参数 使 用 值 传递 的 方式 。1. 6. 6 节 中 曾 讨论 过 参数 传递 方法 。 
DT) 假定 。 是 一 个 整数 数组 , 并 且 上 是 一 个 从 整数 到 整数 的 函数 。 那 么 赋值 语句 

net(alil): 

可 以 被 翻译 成 如 下 的 三 地 址 代码 。 

eee te 

3) param tə 

Alee cari- £, "3 

5) n = tg F 


如 6.4 节 中 讨论 的 , 前 两 行 计算 表达 式 a[ i] 的 值 , 并 将 结果 存放 到 临时 变量 t 中 。 第 3 行 
将 ta 作为 实在 参数 用 于 第 4 行 中 对 £ 的 调用 。 这 个 调用 只 带 有 一 个 参数 。 第 4 行 中 函数 调用 的 
返回 值 被 赋 给 t3。 第 5 行将 返回 值 赋 给 no O 
图 6-52 中 的 产生 式 可 以 生成 函数 定义 和 函数 调用 。( 这 


个 文法 会 在 最 后 一 个 参数 之 后 生成 一 个 不 必要 的 逗号 , 但 是 人 


它 已 经 足以 说 明 翻译 的 方法 了 。) 如 6.3 HIRE, 非 终结 符号 D bs ore 
和 了 分 别 生成 声明 和 类 型 。 由 D 生成 的 函数 定义 包含 了 关键 ee 





F define、 返 回 类 型 、 函 数 名 、 括 号 中 的 形式 参数 以 及 由 一 个 | ， ejb Baa 
位 于 花 括号 中 的 语句 组 成 的 函数 体 。 非 终结 符号 五 生成 0 个 
或 多 个 形式 参数 , 每 个 形式 参数 包括 一 个 类 型 和 一 个 标识 符 。 图 6-52 在 源 语 言 中 加 入 函数 
非 终 结 符 号 5S 秘 分 别 生 成 语句 和 表达 式 。5 的 产生 式 增加 了 一 条 返回 表达 式 值 的 语句 。E 的 产 
生 式 中 增加 了 函数 调用 ,调用 中 的 实在 参数 由 4 生成 。 一 个 实在 参数 就 是 一 个 表达 式 。 
图 数 定 义 和 函 数 调用 可 以 用 本 章 中 已 经 介绍 过 的 概念 进行 翻译 。 
© 函数 类 型 。 一 个 函数 类 型 必须 包含 它 的 返回 值 类 型 和 形式 参数 类 型 。 令 void 是 一 个 表示 
没有 参数 或 没有 返回 值 的 特殊 类 型 。 因 此 , 返回 一 个 整数 的 函数 pop( ) 的 类 型 是 “从 void 
到 integer 的 函数 ”"。 函 数 类 型 可 以 在 返回 值 类 型 和 有 序 的 参数 类 型 列表 上 应 用 构造 算 子 
fun 来 表示 。 
。 符号 表 。 设 编译 器 处 理 到 一 个 函数 定义 时 , 最 上 层 的 符号 表 为 s。 函 数 名 被 放 入 s, 以 便 
在 程序 的 其 他 部 分 使 用 。 函 数 的 形式 参数 可 以 用 类 似 于 记录 字段 名 的 方式 来 处 理 ( 见 图 
6-18)。 在 D 的 产生 式 中 , 在 看 到 关键 字 define 和 函数 名 之 后 , 我 们 将 s 压 栈 并 建立 新 的 
符号 表 
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Env.push(top); top = new Env(top); 
这 个 新 符号 表 被 称 为 to TER, top 被 作为 参数 传递 到 new Env( top), 因此 新 的 符号 表 t 可 
以 被 链接 到 先前 的 符号 表 *。 新 的 符号 表 t 用 于 这 个 函数 的 函数 体 的 翻译 。 在 这 个 函数 体 
被 翻译 完成 之 后 , 我 们 恢复 到 先前 的 符号 表 so 
°. 类 型 检查 。 在 表达 式 中 , 一 个 函数 和 运算 符 的 处 理 方法 相同 。 因 此 在 6. 5. 2 节 中 讨论 的 
， 类 型 检查 规则 (包括 自动 类 型 转换 ) 仍然 可 用 。 例 如 ， 如果/ 是 一 个 带 有 一 个 实数 型 参数 
的 函数 , 那么 在 函数 调用 f(2) 时 , 整数 2 将 被 转换 成 实 型 数 。 
e 浮 数 调用 。 当 为 一 个 函数 调用 id(E, E, , 五) 生成 三 地 址 指令 的 时 候 , 只 需要 生成 对 各 
个 参数 刀 求 值 的 三 地 址 指令 , 或 者 生成 将 各 个 参数 互 归 约 为 地 址 的 三 地 址 指令 ,然后 再 
为 每 个 参数 生成 一 条 param 指令 即 可 。 如 果 我 们 不 愿 将 参数 计算 指令 和 param 指令 混 
在 一 起 , 可 以 将 每 个 表达 式 忆 的 属性 E. addr 存放 到 一 个 数据 结构 ( 比如 队列 ) 中 。 一 旦 所 
有 的 表达 式 都 翻译 完成 ,我们 就 可 以 在 清空 队列 的 同时 生成 param 指令 。 
过 程 是 程序 设计 语言 中 重要 且 常 用 的 编程 结构 ,因此 编译 器 必须 为 过 程 调用 和 返回 生成 良 
好 的 代码 。 用 于 处 理 过 程 的 参数 传递 、 调 用 和 返回 的 运行 时 刻 例 程 是 运行 时 刻 支 持 系统 的 一 部 
分 。 运 行 时 刻 支持 机 制 将 在 第 7 章 中 讨论 。 


6. 10 第 6 章 总 结 


本 章 中 介绍 的 技术 可 以 被 综合 起 来 , 构造 一 个 简单 的 编译 器 前 端 , 比如 附录 A 中 的 那个 编译 
右前 端 。 编 译 器 的 前 端 可 以 增 量 式 地 进行 构造 : 

e 选择 一 个 中 间 表 示 形 式 : 中 间 表 示 形 式 通 常 是 一 个 图 形 表示 方法 和 三 地 址 代码 的 组 合 。 
比如 在 语法 树 中 , 图 中 的 结 点 表示 一 个 程序 构造 ; 而 各 个 子 结 点 表示 其 子 构造 。 三 地 址 
代码 的 名 字源 于 它 的 x=y op z 的 形式 。 每 条 指令 至 多 有 一 个 运算 符 。 另 外 还 有 -一些 用 于 
控制 流 的 三 地 址 指令 。 
翻译 表达 式 : 通过 在 各 个 形 如 E>Ei op E, 的 产生 式 中 加 入 语义 动作 , 带 有 复杂 运算 的 表 
达 式 可 以 被 分 解 成 一 个 由 单一 运算 组 成 的 序列 。 这 些 动 作 或 者 创建 一 个 巨 的 结 点 , 此 结 
METAAN E ME; 或 者 生成 一 条 三 地 址 指令 , 该 指令 对 El ME, 的 地 址 应 用 运算 符 
op, 并 将 其 运算 结果 放 入 一 个 临时 变量 中 。 这 个 临时 变量 就 成 了 E 的 地 址 。 
检查 类 型 : 一 个 表达 式 Ei op E, 的 类 型 是 由 运算 符 op 以 及 El ME, 的 类 型 决定 的 。 自 动 
类 型 转换 (coercion) 是 指 隐 式 的 类 型 转换 , 例如 从 integer 转换 到 float。 中 间 代 码 中 还 包含 
了 显 式 的 类 型 转换 ,以 保证 运算 分 量 的 类 型 和 运算 符 的 期 待 类 型 精确 匹配 。 

使 用 符号 表 米 实现 声明 : 一 个 声明 指定 了 一 个 名 字 的 类 型 。 一 个 类 型 的 宽度 是 指 存放 该 
类 型 的 变量 所 需要 的 存储 空间 。 使 用 宽度 ， 一 个 变量 在 运行 时 刻 的 相对 地 址 可 以 计算 为 
相对 于 某 个 数据 区 域 的 开始 地 址 的 偏 移 量 。 每 个 声明 都 会 将 一 个 名 字 的 类 型 和 相对 地 址 
放 人 符号 表 , 这 样 当 这 个 名 字 后 来 出 现在 一 个 表达 式 中 时 ， 翻译 器 就 可 以 获取 这 些 信息 。 
将 数组 扁平 化 : 为 实现 快速 访问 , 数组 元 素 被 存放 在 一 段 连续 的 空间 内 。 数 组 的 数组 可 
以 被 扁平 化 ， 当 作 各 个 元 素 的 一 维 数组 进行 处 理 。 数 组 的 类 型 用 于 计算 一 个 数组 元 素 相 
对 于 数组 基地 址 的 偏 移 量 。 

为 布尔 表达 式 产 生 跳 转 代 码 : 在 短路 (或 者 说 跳 转 ) 代 码 中 ， 布尔 表达 式 的 值 被 隐 含 在 代 
人 码 所 到 达 的 位 置 中 。 因 为 布尔 表达 式 B 常常 被 用 于 决定 控制 流 , 例如 在 if(B)S 中 就 是 这 
PE, 因此 跳 转 指令 是 有 用 的 。 只 要 使 得 程序 正确 地 跳 转 到 代码 t = true 或 上 = flase 
处 , 就 可 以 计算 出 布尔 值 , 其 中 的 :是 一 个 临时 变量 。 使 用 跳 转 标号 ， 通过 继承 对 应 于 一 
个 布尔 表达 式 的 真 假 出 口 的 标号 , 就 可 以 对 布尔 表达 式 进 行 翻译 。 常 量 rue All false 分 别 
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被 翻译 成 跳 转 到 真 值 出 口 和 假 值 出 口 的 指令 。 

o 用 控制 流 实现 语句 : 通过 继承 next 标号 就 可 以 实现 语句 的 翻译 , 其 中 next 标记 了 这 个 语 
句 的 代码 之 后 的 第 一 条 指令 。 翻 译 条 件 语句 5 一 过 (B)S, 时， 只 需要 将 一 个 标记 了 51 的 
代码 起 始 位 置 的 新 标号 和 S. next 分 别 作 为 B 的 真 值 出 口 和 假 值 出 口传 递 给 其 他 处 理 
程序 。 

© 可 以 选择 使 用 回填 技术 : 回填 是 一 种 为 布尔 表达 式 和 语句 进行 一 趟 式 代码 生成 的 技术 。 
其 基本 思想 是 维护 多 个 由 不 完整 跳 转 指令 组 成 的 列表 ， 在 同一 列表 中 的 指令 具有 同样 的 
跳 转 目标 。 当 目标 位 置 已 知 时 ， 将 为 相应 列表 中 的 所 有 指令 填 入 这 个 目标 。 

。 实现 记录 : 记录 或 类 中 的 字段 名 可 以 当 作 声 明 序列 进行 处 理 。 一 个 记录 类 型 包含 了 关于 
它 的 各 个 域 的 类 型 和 相对 地 址 的 信息 。 可 以 使 用 一 个 符号 表 对 象 来 实现 这 个 目的 。 
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第 7 章 ， 运 行 时 刻 环境 


编译 器 必须 准确 地 实现 源 程 序 语言 中 包含 的 各 个 抽象 概念 。 这 些 抽象 概念 通常 包括 我 们 在 
1.6 节 中 曾经 讨论 过 的 那些 概念 , 如 名 字 、 作 用 域 、 绑 定 、 数 据 类 型 、 运 算 符 、 过 程 、 参 数 以 及 控 
制 流 构造 。 编 译 器 还 必须 和 操作 系统 以 及 其 他 系统 软件 协作 , 在 目标 机 上 支持 这 些 抽象 概念 。 

为 了 做 到 这 一 点 , 编译 器 创建 并 管理 一 个 运行 时 刻 环境 (run-time environment) ， 它 编译 得 到 
的 目标 程序 就 运行 在 这 个 环境 中 。 这 个 环境 处 理 很 多 事务 , 包括 为 在 源 程序 中 命名 的 对 象 分 配 
和 安排 存储 位 置 , 确定 目标 程序 访问 变量 时 使 用 的 机 制 , 过程 间 的 连接 , 参数 传递 机 制 , 以 及 与 
操作 系统 、 输 入 输出 设备 及 其 他 程序 的 接口 。 

未 章 的 两 个 主题 是 存储 位 置 的 分 配 和 对 变量 及 数据 的 访问 。 我 们 将 详细 地 讨论 存储 管理 ， 
包括 栈 分 配 、 堆 管 理 和 垃圾 回收 。 我 们 将 在 下 一 章 中 介绍 为 多 种 常见 语言 构造 生成 目标 代码 的 
技术 。 


7.1 FRAR 


从 编译 器 编写 者 的 角度 来 看 , 正在 执行 的 目标 程序 在 它 自己 的 逻辑 地 址 空间 内 运行 , 其 中 每 
个 程序 值 都 在 这 个 空间 中 有 一 个 地 址 。 对 这 个 逻辑 地 址 空间 的 管理 和 组 织 是 由 编译 器 、 操 作 系 
统 和 目标 机 共同 完成 的 。 操 作 系 统 将 逻辑 地 址 映射 为 物理 地 址 ， 而 物理 地 址 对 整个 内 存 空间 








编 址 。 
.个 目标 程序 在 逻辑 地 址 空间 的 运行 时 刻 映像 包含 a ne a 

数据 区 和 代码 区 , 如 图 7-1 所 示 。 某 个 语言 (比如 C++) E 

在 某 个 操作 系统 ( 比如 Linux) 上 的 编译 器 可 能 按照 这 种 方 wie 

式 划分 存储 空间 。 | 
在 本 书 中 , 我 们 假定 运行 时 刻 存储 是 以 多 个 连续 字 堆 区 

节 块 的 方式 出 现 的 , 其 中 字 节 是 内 存 的 最 小 编 址 单元 。 

二 个 字 节 包含 8 个 二 进 制 位 ; 4 个 字 节 构成 一 个 机 器 字 。 空间 内 存 

多 字 节 数据 对 象 总 是 存储 在 一 段 连 续 的 字 节 中 ,， 并 把 第 

一 个 字 节 作为 它 的 地 址 。 RE 











第 6 章 中 讨论 过 , 一 个 名 字 所 需要 的 存储 空间 大 小 是 i 
由 它 的 类 型 决定 的 。 基 本 数据 类 型 ， 比 如 字符 、 整 数 或 浮 ET 运行 时 刻 内 存 被 划分 成 代码 
点 数 , 可 以 存储 在 整数 个 字 节 中 。 聚 合 类 型 ( 比如 数组 或 区 和 数据 区 的 典型 方式 
结构 ) 的 存储 空间 大 小 必须 足以 存放 这 个 类 型 的 所 有 分 量 。 

数据 对 象 的 存储 布局 受 目标 机 的 寻 址 约束 的 影响 很 大 。 在 很 多 机 器 中 , 执行 整数 加 法 的 指 
令 可 能 要 求 整数 是 对 齐 的 , 也 就 是 说 这 些 数 必须 被 放 在 一 个 能 够 被 4 整除 的 地 址 上 。 尽 管 在 C 
语言 或 者 类 似 的 语言 中 一 个 有 10 个 字符 的 数组 只 需要 能 够 存放 10 个 字符 的 空间 , 但 是 编译 器 可 
能 为 了 对 齐 而 给 它 分 配 12 个 字 节 , 其 中 的 两 个 字 节 未 使 用 。 因 为 对 齐 的 原因 而 产生 的 闲置 空间 
称 为 补 白 (padding) 。 如 果 空 间 比 较 紧张 , 编译 器 可 能 会 压缩 数据 以 消除 补 白 。 但 是 , 在 运行 时 
刻 可 能 需要 额外 的 指令 来 定位 被 压缩 数据 , 使 得 机 器 在 操作 这 些 数据 时 就 好 像 它们 是 对 齐 的 。 

生成 的 目标 代码 的 大 小 在 编译 时 刻 就 已 经 固定 下 来 了 , 因此 编译 器 可 以 将 可 执行 目标 代码 
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放 在 一 个 静态 确定 的 区 域 : 代码 区 。 这 个 区 通常 位 于 存储 的 低 端 。 类 似 地 , 程序 的 某 些 数据 对 旬 
的 大 小 可 以 在 编译 时 刻 知道 , 它们 可 以 被 放置 在 另 一 个 称 为 静态 区 的 区 域 中 , 该 区 域 可 以 被 静态 
确定 。 放 置 在 这 个 区 域 的 数据 对 象 包括 全 局 常量 和 编译 器 产生 的 数据 ,比如 用 于 支持 垃圾 回收 
的 信息 等 。 之 所 以 要 将 尽 可 能 多 的 数据 对 象 进行 静态 分 配 , 是 因为 这 些 对 象 的 地 址 可 以 被 编译 
到 目标 代码 中 。 在 Fortran 的 早期 版 本 中 ， 所 有 数据 对 象 都 可 以 进行 静态 分 配 。 

为 了 将 运行 时 刻 的 空间 利用 率 最 大 化 ， 另 外 两 个 区 域 -- 栈 和 堆 被 放 在 剩余 地 址 空间 的 相 
对 两 端 。 这 些 区 域 是 动态 的 ， 它 们 的 大 小 会 随 着 程序 运行 而 改变 。 这 两 个 区 域 根据 需要 向 对 方 
增长 。 栈 区 用 来 存放 称 为 活动 记录 的 数据 结构 ,这 些 活动 记录 在 函数 调用 过 程 中 生成。 

在 实践 中 , 栈 向 较 低地 址 方向 增长 ， 而 堆 向 较 高 地 址 方向 增长 。 然 而 , 在 本 章 及 下 一 章 中 ， 
我 们 将 假定 栈 向 较 高 地 址 方向 增长 ， 以 便 我 们 能 够 在 所 有 例子 中 方便 地 使 用 正 的 偏 移 量 。 

我 们 将 在 下 一 节 看 到 ,一 个 活动 记录 用 于 在 一 个 过 程 调用 发 生 时 记录 有 关机 器 状态 的 信息 ， 
例如 程序 计数 器 和 机 器 寄存 器 的 值 。 当 控制 从 该 次 调用 返回 时 ,相关 寄存 器 的 值 被 恢复 ,程序 计 
数 器 被 设置 成 指向 紧 跟 在 这 次 调用 之 后 的 点 ， 然后 调用 过 程 的 活动 就 可 以 重新 开始 。 如 果 一 个 
数据 对 象 的 生命 周期 包含 在 一 次 活动 的 生命 期 中 ,那么 该 对 象 可 以 和 其 他 关于 该 活动 的 信息 一 
起 被 分 配 到 栈 区 上 。 

很 多 程序 设计 语言 支持 程序 员 通 过 程序 控制 人 工分 配 和 回收 数据 对 象 。 例 如 ,C 语言 中 的 
malloc 和 free 函数 可 以 用 来 获取 及 释放 任意 存储 块 。 堆 区 被 用 来 管理 这 种 具有 长 生命 周期 的 
数据 。7. 4 节 中 将 讨论 多 种 可 以 用 来 维护 堆 区 的 存储 管理 算法 。 
静态 和 动态 存储 分 配 

数据 在 运行 时 刻 环境 中 的 内 存 位 置 的 布局 及 分 配 是 存储 管理 的 关键 问题 。 这 些 问题 需要 说 
慎 对 待 ， 因 为 程序 文本 中 的 同一 个 名 字 可 能 在 运行 时 刻 指向 不 同 的 存储 位 置 。 两 个 形容 词 送 起 
(static) 和 动态 (dynamic) 分 别 表示 编译 时 刻 和 运行 时 刻 。 如 果 编译 器 只 需要 通过 观察 程序 文本 即 
可 做 出 某 个 存储 分 配 决定 ， 而 不 需要 观察 该 程序 在 运行 时 做 了 什么 ; 我 们 就 认为 这 个 存储 分 配 决 
定 是 静态 的 。 反 过 来 ,如 果 只 有 在 程序 运行 时 才能 做 出 决定 ;那么 这 个 决定 就 是 动态 的 。 很 多 编 
译 器 使 用 下 列 两 种 策略 的 某 种 组 合 进行 动态 存储 分 配 ， 

1) 栈 式 存储 。 一 个 过 程 的 局 部 名 字 在 栈 中 分 配 空间 。 我们 将 从 7.2 节 开 始 讨论 “运行 时 刻 
栈 "。 这 种 栈 支持 通常 的 过 程 调用 /返回 策略 。 

2) 准 存储 。 有 些 数据 的 生命 周期 要 比 创造 它 的 某 次 过 程 调用 更 长 ， 这 些 数据 通常 被 分 配 在 
一 个 可 复 用 存储 的 “ 堆 " 中 。 我 们 将 从 7.4 节 开始 讨论 坛 管理 ;' 扒 是 虚拟 内 存 的 -个 区 域 ， 它 多 
许 对 象 或 其 他 数据 元 素 在 被 创建 时 获得 存储 空间 ,并 在 数据 变 得 无 效 时 释放 该 存储 空间 ， 

为 了 支持 堆 区 管理 , 通过 “垃圾 回收 "使 得 运行 时 刻 条 统 能 够 检测 出 无 用 的 数据 元 素 ， 即 使 
程序 员 没有 显 式 地 释放 它们 的 空间 , 运行 时 刻 系统 也 能 够 复 用 这 些 存储 。 尽 管 自动 垃圾 回收 机 
制 是 一 个 难以 高 效 完成 的 操作 , 但 它 仍 是 很 多 现代 程序 设计 语言 的 一 个 重要 特征 。 对 于 某 些 语 
言 来 说 , 垃圾 回收 甚至 是 不 可 能 完成 的 。 


7.2 空间 的 栈 式 分 配 


有 些 语 言 使 用 过 程 、 函 数 或 方法 作为 用 户 自 定义 动作 的 单元 ; 几乎 所 有 针对 这 些 语音 的 编译 
器 都 把 它们 的 (至 少 一 部 分 的 ) 运行 时 刻 存储 按照 一 个 栈 进行 管理 。 每 当 一 个 过 程 6 被 调用 时 ， 


O 请 回忆 一 下 ,“ 过 程 " 这 个 词 是 函数 、 过 程 、 方 法 和 子 例 程 的 统称 。 
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用 于 存放 该 过 程 的 局 部 变量 的 空间 被 压 人 栈 ; 当 这 个 过 程 结束 时 ， 该 空间 被 弹出 这 个 栈 。 我 们 将 
看 到 , 这 种 安排 不 仅 允 许 活跃 时 段 不 交 芭 的 多 个 过 程 调 用 之 间 共 享 空间 ,而 且 允 许 我 们 以 如 下 方 
式 为 一 个 过 程 编译 代码 : 它 的 非 局 部 变量 的 相对 地 址 总 是 固定 的 ， 和 过 程 调 用 的 序列 无 关 。 
7.2.1 活动 树 

假如 过 程 调 用 (或 者 说 过 程 的 活动 ) 在 时 间 上 不 是 嵌 套 的 , 那么 栈 式 分 配 就 不 可 行 了 。 下 面 
的 例子 说 明了 过 程 调用 的 柑 套 情形 。 
| 例 7. 1 | 图 7 了 2 给 出 了 一 个 程序 的 概要 。 该 程序 将 9 个 整数 读 人 到 一 个 数组 a, 并 使 用 递归 的 决 
速 排序 算法 对 这 些 整 数 排序 。 


ba! 
int af11]; 
void readArray() { /* 将 9 个 整数 读 入 到 a[1],.…,a[9] 中 。*/ 


AAC E; 





} 
int partition(int m, int n) { 
/* ERa, Halm.. n], 
tE afm.. p- 1 AF v, ap =u, 
并 且 alp 十 1..n] 大 于 等 于 wv。 返回 p: */ 


} 
void quicksort(int m, int n) { 
intr 
if (n>m) { 
i = partition(m, n); 
quicksort(m, i-1); 
quicksort(i+1, n); 


} 

} 

main() { 
readArray(); 
af[0] = -9999; 
a[10] = 9999; 
quicksort (1,9); 








图 7-2 ”一 个 快速 排序 程序 的 概要 


程序 的 主 函 数 有 三 个 任务 。 它 调用 readArray, Æ E FR, 然后 在 整个 数组 之 上 调用 
quicksort, K] 7-3 给 出 了 可 能 在 程序 的 某 次 执行 中 得 到 的 调用 序列 ， 在 这 次 执行 中 , 对 partition 
(1, 9) 的 调用 返回 4, 因此 a[1] 到 al3] 存 放 了 小 于 被 选 定 的 分 割 值 。 的 元 素 , 而 较 大 的 元 素 被 存 
放 在 a[5] 到 a[9]。 o 

在 这 个 例子 中 ， 过 程 活动 在 时 间 上 是 向 套 的 ， 在 一 般 情 况 下 也 是 这 样 。 如 果 过 程 p 的 二 个 活 
动 调用 了 过 程 g, 那么 g 的 该 次 活动 必定 在 p 的 活动 结束 之 前 结束 。 有 三 种 常见 的 情况 : 

1) g 的 该 次 活动 正常 结束 ， 那么 基本 上 在 任何 语言 中 ， 控制 流 从 bp 中 调用 g 的 点 之 后 继续 。 

2) q 的 该 次 活动 (或 9 调用 的 某 个 过 程 ) 直接 或 间接 地 中 止 了 ， 也 就 是 说 不 能 再 继续 执行 了 。 
在 这 种 情况 下 , q Al 同时 结束 。 

3) 4 的 该 次 活动 因为 9 不 能 处 理 的 某 个 异常 而 结束 。 过 程 p 可 能 会 处 理 这 个 异常 。 此 时 g 的 活 
动 已 经 结束 而 p 的 活动 继续 执行 , 尽管 P 的 活动 不 一 定 从 调用 gq 的 点 开始 。 WR p 不 能 处 理 这 个 异 
W, 那么 p 的 活动 和 g 的 活动 一 起 结束 。 一 般 来 说 某 个 过 程 的 尚未 结束 的 活动 将 处 理 这 个 异常 。 

因此 ， 我 们 可 以 用 一 棵 树 来 表示 在 整个 程序 运行 期 间 的 所 有 过 程 的 活动 这 棵 树 称 为 活动 树 
(activation tree) 。 树 中 的 每 个 结 点 对 应 于 一 个 活动 ， 根 结 点 是 启动 程序 执行 的 main 过 程 的 活动 。 
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在 表示 过 程 p 的 某 个 活动 的 结 点 上 , 其 子 结 点 对 应 于 被 p 的 这 次 活动 调用 的 各 个 过 程 的 活动 。 我 
们 按照 这 些 活动 被 调用 的 顺序 , 自 左 向 右 地 显示 它们 。 值 得 注意 的 是 , 一 个 子 结 点 必须 在 其 右 兄 
第 结 点 的 活动 开始 之 前 结束 。 





一 种 快速 排序 

图 72 中 的 快速 排序 程序 概要 使 用 了 两 个 辅助 函数 readhrray 和 partition, B% readArray 
仅 用 于 将 数据 加 载 到 数组 a 中 。 数 组 a 的 第 一 个 和 最 后 一 个 元 素 没有 用 于 存放 输入 数据 , 而 
是 用 于 存放 主 函数 中 设 定 的 “ 限 值 ”。 我 们 假定 a[01 被 设 为 小 于 所 有 可 能 输入 数据 值 的 值 ， 
而 a[10] 被 设 为 大 于 所 有 数据 值 的 值 。 

函数 partition 对 数组 中 第 m 个 元 素 到 第 nn 个 元 素 的 部 分 进行 分 割 , 使 得 a[m] 到 a[n] 之 
间 的 小 元 素 存 放 在 前 面 , 而 大 的 元 素 存 放 在 尾部 , 但 是 这 两 组 内 部 不 一 定 是 排 好 序 的 。 我 们 
将 不 会 探究 partition 的 工作 方式 , 只 需要 知道 这 个 过 程 要 求 前 面 提 到 的 上 下 限 值 必 须 存在 。 
图 9-1 中 的 更 加 详细 的 代码 给 出 了 实现 partition 的 一 种 可 能 的 算法 。 

递归 过 程 quicksort 首先 确定 它 是 否 需 要 对 多 个 数组 元 素 进行 排序 。 请 注意 , 单个 元 素 总 
是 “有 序 的 ”, 因此 在 这 种 情况 下 quicksort 不 需要 做 任何 事 。 如 果 有 多 个 元 素 需 要 排序 ，guick- 
sort 首先 调用 partition。 这 次 调用 会 返回 一 个 数组 下 标 i, 它 是 小 元 素 和 大 元 素 之 间 的 分 界线 。 
然后 通过 递归 调用 quicksort 对 这 两 组 元 素 排序 。 








图 73 给 出 了 一 个 调用 和 返回 序列 , 而 图 7- 4 中 显示 了 一 棵 完成 这 个 调用 /返回 序 
列 的 可 能 的 活动 树 。 各 个 函数 用 它 的 函数 名 的 第 一 个 Taa nano 








字母 表示 。 请 记 住 , 这 个 树 只 代表 了 一 种 可 能 性 , 因 enter readArray() 
为 后 续 调用 的 参数 会 有 不 同 , 并且 各 个 分 支 上 的 调用 te 
次 数 会 受到 partition 的 返回 值 的 影响 。 口 enter partition(1,9) 


在 活动 树 和 程序 行为 之 间 存在 下 列 多 种 有 用 的 对 a rane opt 
应 关系 , 正 是 因为 这 些 关系 使 我 们 可 以 使 用 运行 时 
刻 栈 ; 
1) 过 程 调 用 的 序列 和 活动 树 的 前 序 遍 历 相对 应 。 
2) 过 程 返回 的 序列 和 活动 树 的 后 序 遍 历 相 对 应 。 ar eer 
3) 假定 控制 流 位 于 某 个 过 程 的 特定 活动 中 , 且 该 1 
过 程 活动 对 应 于 活动 树 上 的 某 个 结 点 W。 那 么 当前 沿 
未 结束 的 ( 即 活路 的) 活动 就 是 结 点 N 及 其 祖先 结 点 ”图 73 图 7-2 中 程序 的 可 能 的 活动 序列 
对 应 的 活动 。 这 些 活动 被 调用 的 顺序 就 是 它们 在 从 根 结 点 到 NN 的 路 径 上 的 出 现 顺序 。 这 些 活动 
将 按照 这 个 顺序 的 反 序 返回 。 


m 


leave quicksort(1,3) 
enter quicksort (5,9) 





r q(1, 9) 
ee ee © 
p(1,9) q(1,3) q(5,9) 
5 a 
p(1,3) g(1,0) q(2,3) Pee (559), l5, 5) La on, 
pa tie Fe ae 
p(2,3) (2,1) 9(3,3) P(7,9) (7,7) (9,9) 


图 7-4 表示 quicksort 的 某 次 运行 中 的 调用 的 活动 树 
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7.2.2 活动 记录 

过 程 调用 和 返回 通常 由 一 个 称 为 控制 栈 ( control stack) 的 运行 时 刻 栈 进行 管理 。 每 个 活跃 的 
活动 都 有 一 个 位 于 这 个 控制 栈 中 的 活动 记录 ( activation record， 有 时 也 称 为 帧 (frame) ) 。 活 动 树 
的 根 位 于 楼 底 , 栈 中 全 部 活动 记录 的 序列 对 应 于 在 活动 树 中 到 达 当 前 控制 所 在 的 活动 结 点 的 路 
径 。 程 序 控制 所 在 的 活动 的 记录 位 于 栈 顶 。 
如 果 当 前 的 控制 位 于 图 7-4 的 树 中 的 活动 9(2, 3) 上 , 那么 9(2, 3) 对 应 的 活动 记录 在 
控制 栈 的 顶端 。 紧 跟 在 下 面 的 是 9(1, 3) 的 活动 记录 , 即 树 中 g(2, 3 ) 的 父 结 点 。 再 下 面 是 4(1， 
9) 的 活动 记录 。 栈 的 底 端 是 主 函 数 m 的 活动 记录 , 也 就 是 活动 树 的 根 。 口 

按照 惯例 , 我 们 在 画 控 制 栈 的 时 候 将 把 栈 底 画 在 栈 顶 之 上 。 因 此 在 一 个 活动 记录 中 出 现在 
页 面 最 下 方 的 元 素 实际 上 最 靠近 栈 顶 。 

根据 所 实现 语言 的 不 同 , 其 活动 记录 的 内 容 也 有 所 不 同 。 这 里 列举 出 可 能 出 现在 一 个 活动 
记录 中 的 各 种 类 型 的 数据 (图 7-5 列 出 了 这 些 元 素 以 及 它们 之 间 的 可 能 顺序 ) : 

1) 临时 值 。 比 如 当 表 达 式 求 值 过 程 中 产生 的 中 间 结果 无 法 存放 在 寄存 器 中 时 ,就 会 生成 这 
些 临 时 值 。 

2) 对 应 于 这 个 活动 记录 的 过 程 的 局 部 数据 。 

3) 保存 的 机 器 状态 , 其 中 包括 对 此 过 程 的 此 次 调用 之 前 的 机 器 状态 信息 。 这 些 信息 通常 包 
括 返回 地 址 (程序 计数 器 的 值 , 被 调用 过 程 必须 返回 到 该 值 所 指 位 置 ) 和 一 些 寄存 器 中 的 内 容 ( 调 
用 过 程 会 使 用 这 些 内 容 , 被 调用 过 程 必须 在 返回 时 恢复 这 些 内 容 ) 。 

4) 一 个 “访问 链 "。 当 被 调用 过 程 需要 其 他 地 方 ( 比如 另 
一 个 活动 记录 ) 的 某 个 数据 时 需要 使 用 访问 链 进行 定位 。 访 问 
链 将 在 7.3.5 节 中 讨论 。 

5) 一 个 控制 链 (control link) ,指向 调用 者 的 活动 记录 。 

6) 当 被 调用 函数 有 返回 值 时 , 要 有 一 个 用 于 存放 这 个 返 
回 值 的 空间 。 不 是 所 有 的 被 调用 过 程 都 有 返回 值 ,即使 有 , 我 
们 也 可 能 倾向 于 将 该 值 放 到 一 个 寄存 器 中 以 提高 效率 。 

7) 调用 过 程 使 用 的 实在 参数 (actual parameter) 。 这 些 值 L 
通常 将 尽 可 能 地 放 在 寄存 器 中 , 而 不 是 放 在 活动 记录 中 ,因为 临时 变量 
放 在 寄存 器 中 会 得 到 更 好 的 效率 。 然 而 , 我们 仍然 为 它们 预 留 ge 
了 相应 的 空间 , 使 得 我 们 的 活动 记录 具有 完全 的 通用 性 。 eye 
DE 图 7-6 给 出 了 当 控制 流 在 图 7-4 所 示 的 活动 树 中 运行 时 运行 时 刻 栈 的 多 个 快照 。 这 些 
不 完整 的 树 中 的 虚线 指向 已 经 结束 的 活动 。 程 序 的 执行 随 着 过 程 main 的 一 次 活动 而 开始 。 因 为 
数组 是 全 局 的 , 在 此 之 前 已 经 为 a 分 配 了 存储 空间 , 如 图 7-6a 所 示 。 

当 控制 到 达 main 的 函数 体 中 的 第 一 个 函数 调用 时 ， 过程， 被 激活 ; 它 的 活动 记录 被 压 人 栈 
中 (参见 图 7-6b) 。r 的 活动 记录 包含 了 局 部 变量 ;的 空间 。 请 记 住 栈 顶 是 在 图 的 下 方 。 当 控制 从 
这 次 活动 中 返回 时 , 它 的 记录 被 弹出 栈 , 栈 中 只 留 下 main 的 记录 。 

然后 控制 到 达 实在 参数 为 1 和 9 的 对 9( 即 快速 排序 ) 的 调用 , 这 次 调用 的 活动 记录 被 放置 在 
栈 顶 , 如 图 7-6c 所 示 。g 的 活动 记录 中 包括 了 参数 m An 以 及 局 部 变量 i 的 空间 。 它 们 按照 图 
7-5 所 示 的 通用 布局 放置 。 请 注意 , 曾经 被 + 的 调用 使 用 的 空间 被 复 用 了 。 函数 调用 9(1, 9) 没有 
任何 方法 找到 7 的 局 部 数据 。 当 4(1, 9) 返 回 时 , 栈 中 再 次 只 剩 下 了 main 的 活动 记录 。 
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n 
integer alll 


a) 7 被 弹出 栈 b) 7 被 激活 








main 
| 
j 


r 4,9) 


main 
‘sl 
z 


r  g@.9) 





p(1,9) a(1,3) 


1 





c) /被 弹出 栈 ,4(1, 9) 被 压 栈 d) 控制 返回 到 q(1, 3) 
图 7-6 向 下 增长 的 活动 记录 栈 


p(1,3) a(1,0) 





在 图 7-6 的 最 后 两 个 快照 之 间 发 生 了 多 个 活动 。4(1, 9) 递 归 地 调用 了 4(1, 3). Æq, 3) 
的 生命 期 内 , 活动 p(1, 3) 和 g(1, 0) 开始 执行 并 结束 , 栈 顶 只 留 下 了 活动 记录 4(1, 3)( 见 图 
7-6d) 。 注 意 ， 当 一 个 过 程 是 递归 的 时 , 常常 会 有 该 过 程 的 多 个 活动 记录 同时 出 现在 栈 中 。 口 
7.2.3 调用 代码 序列 

实现 过 程 调用 的 代码 段 称 为 调用 代码 序列 (calling sequence) 。 这 个 代码 序列 为 一 个 活动 记录 
在 栈 中 分 配 空间 , 并 在 此 记录 的 字段 中 填写 信息 。 返 回 代码 序列 (retum sequence) 是 一 段 类 似 的 
代码 , 它 恢复 机 器 状态 , 使 得 调用 过 程 能 够 在 调用 结束 之 后 继续 执行 。 

即使 对 于 同一 种 语言 , 不 同 实 现 中 的 调用 代码 序列 和 活动 记录 的 布局 也 可 能 千差万别 。 一 个 调 
用 代码 序列 中 的 代码 通常 被 分 割 到 调用 过 程 (调用 者 ) 和 被 调用 过 程 (被 调用 者 ) 中 。 在 分 割 运行 时 
刻 任务 时 , 调用 者 和 被 调用 者 之 间 不 存在 明确 界限 。 源 语言 、 目 标 机 器 、 操 作 系统 会 提出 某 些 要 求 ， 
使 得 能 够 选择 出 一 种 较 好 的 分 割 方案 。 总 的 来 说 , 如 果 一 个 过 程 在 n 个 不 同 点 上 被 调用 , 分 配给 调 
用 者 的 那 部 分 调用 代码 序列 会 被 生成 n 次 。 然 而 , 分 配给 被 调用 者 的 部 分 只 被 生成 一 次 。 因 此 , 我 
们 期 望 把 调用 代码 序列 中 尽 可 能 多 的 部 分 放 在 被 调用 者 中 一 一 能 够 根据 被 调用 者 的 信息 确定 的 部 
分 都 应 该 放 到 被 调用 者 中 。 不 过 , 我 们 将 看 到 , 被 调用 者 不 可 能 知道 所 有 的 事情 。 

在 设计 调用 代码 序列 和 活动 记录 的 布局 时 , 可 以 使 用 下 列 的 设计 原则 : 

1) 在 调用 者 和 被 调用 者 之 间 传 递 的 值 一 般 被 放 在 被 调用 者 的 活动 记录 的 开始 位 置 , 因此 它 
们 尽 可 能 地 靠近 调用 者 的 活动 记录 。 这 样 做 的 动机 是 , 调用 者 能 够 计算 该 次 调用 的 实在 参数 的 
值 并 将 它 放 在 自身 活动 记录 的 顶部 , 而 不 用 创建 整个 被 调用 者 的 活动 记录 , 甚至 不 用 知道 该 记录 
的 布局 。 不 仅 如 此 , 它 还 使 得 语言 可 以 使 用 参数 个 数 或 类 型 可 变 的 过 程 ， 比 如 C 语言 中 的 
printf 函数 。 被 调用 者 知道 应 该 把 返回 值 放置 在 相对 于 它 自己 的 活动 记录 的 哪个 位 置 。 同 时 ， 
不 管 有 和 多少 个 参数 , 它们 都 将 在 栈 中 顺序 地 出 现在 该 位 置 之 下 。 

2) 固定 长 度 的 项 被 放置 在 中 间 位 置 。 根 据 图 7-5, 这 样 的 项 通常 包括 控制 链 、 访问 链 和 机 器 
状态 字段 。 如 果 每 次 调用 中 保存 的 机 器 状态 的 成 分 相同 , 那么 可 以 使 用 同一 段 代码 来 保存 和 恢 
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复 每 次 调用 的 数据 。 不 仅 如 此 ,如果 我 们 将 机 器 状态 信息 标准 化 , 那么 当 错 误 发 生 时 , 诸如 调试 
器 这 样 的 程序 将 可 以 更 容易 地 将 栈 中 的 内 容 解码 。 

3) 那些 在 早期 不 知道 大 小 的 项 将 被 放置 在 活动 记录 的 尾部 。 大 部 分 局 部 变量 具有 固定 的 长 度 ， 
编译 器 通过 检查 该 变量 的 类 型 就 可 以 确定 其 长 度 。 然 而 , 有 些 局 部 变量 的 大 小 只 有 在 程序 运行 时 才 
能 确定 。 最 常见 的 例子 是 动态 数组 , 数组 大 小 根据 被 调用 者 的 某 个 参数 决定 。 另 外 , 临时 量 所 需 空 
间 的 大 小 通常 依赖 于 代码 生成 阶段 能 够 将 多 少 临时 变量 放 在 寄存 器 中 。 因 此 , 虽然 编译 器 最 终 可 以 
知道 临时 变量 所 需要 的 空间 , 但 在 刚 开始 生成 中 间 代 码 时 可 能 并 不 知道 该 空间 的 大 小 。 

4) 我 们 必须 小 心地 确定 栈 项 指针 所 指 的 位 置 。 一 个 常用 的 方法 是 让 这 个 指针 指向 活动 记录 
中 国定 长 度 字段 的 末端 。 这 样 , 固定 长 度 的 数据 就 可 以 通过 固定 的 相对 于 栈 顶 指针 的 偏 移 量 来 
访问 ， 而 中 间 代 码 生成 器 知道 这 些 偏 移 量 。 使 用 这 种 方法 的 后 果 是 活动 记录 中 的 变 长 域 实 际 上 
位 于 栈 项 “之 上 ”。 它 们 的 偏 移 量 需要 在 运行 时 刻 进行 计算 , 但 是 它们 仍然 可 以 基于 栈 顶 指针 进 
行 访问 , 但 是 偏 移 量 为 正 。 

图 7-7 给 出 了 调用 者 和 被 调用 者 如 何 合作 管理 调用 栈 的 一 个 例子 。 寄 存 器 top_sp 指向 当前 的 
顶层 活动 记录 中 机 器 状态 字段 的 末端 。 调 用 者 知道 这 个 位 于 被 调用 者 的 活动 记录 中 的 位 置 。 因 
此 , 调用 者 可 以 负责 在 控制 转向 被 调用 者 之 前 设 定 top_sp 的 值 。 这 个 调用 代码 序列 以 及 它 在 调用 
者 和 被 调用 者 之 间 的 划分 描述 如 下 : 

1) 调用 者 计算 实在 参数 的 值 。 

2) 调用 者 将 返回 地 址 和 原来 的 top_sp 值 存放 到 被 调用 者 的 活动 记录 中 。 然 后 , 调用 者 增加 
top_sp 的 值 , 使 之 指向 图 7-7 所 示 的 位 置 。 也 就 是 说 , top_sp 越过 了 调用 者 的 局 部 数据 和 临时 变量 
以 及 被 调用 者 的 参数 和 机 器 状态 字段 。 

3) 被 调用 者 保存 寄存 器 值 和 其 他 状态 信息 。 

4) 被 调用 者 初始 化 其 局 部 数据 并 开始 执行 。 

















调用 者 的 
A 活动 记录 

调用 者 

的 职责 

参数 和 返回 什 | 
ee OO $ 被 调用 者 的 
链接 和 被 保存 的 状态 | 活动 记录 
ie? “tt ae 被 调用 者 
临时 变量 和 局 部 数据 i 


图 7-7 ”调用 者 和 被 调用 者 之 间 的 任务 划分 


一 个 与 此 匹配 的 返回 代码 序列 如 下 : 

1) 如 图 7-5 所 示 , 被 调用 者 将 返回 值 放 到 与 参数 相 邻 的 位 置 。 

2) 使 用 机 器 状态 字段 中 的 信息 , 被 调用 者 恢复 top_sp 和 其 他 寄存 器 ， 然后 跳 转 到 由 调用 者 
放 在 机 器 状态 字段 中 的 返回 地 址 。 

3) 尽管 iop_sp 已 经 被 减 小 ， 但 调用 者 仍然 知道 返回 值 相对 于 当前 iop_sp 值 的 位 置 。 因 此 , 调 
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用 者 可 以 使 用 那个 返回 值 。 

上 面 的 调用 和 返回 代码 序列 支持 使 用 不 同 数量 的 参数 来 调用 同一 个 被 调用 程序 (就 像 C 语言 
中 的 printf 函数 那样 ) 。 请 注意 , 在 编译 时 刻 , 调用 者 的 目标 代码 知道 它 向 被 调用 者 提供 的 参 
数 的 数量 和 类 型 。 因 此 ,调用 者 知道 参数 区 域 的 大 小 。 然 而 , 被 调用 者 的 目标 代码 必须 还 能 处 理 
其 他 调用 , 因此, 它 要 等 到 被 调用 时 再 检查 相应 的 参数 字段 。 使 用 图 7.7 中 的 组 织 方法 ,描述 参 
数 的 信息 必定 放置 在 状态 字段 的 相 令 位置 , 因此 被 调用 者 可 以 找到 这 个 信息 。 例 如 , 在 C 语言 
printf MAH, 第 一 个 参数 描述 了 其 余 的 参数 , 因此 一 旦 找到 了 第 一 个 参数 ,调用 者 就 可 以 找 
到 所 有 的 其 他 参数 。 

7. 2. 4 ， 酚 中 的 变 长 数据 

运行 时 刻 存储 管理 系统 必须 频繁 地 处 理 某 些 数据 对 象 的 空间 分 配 。 这 些 数据 对 象 的 大 小 在 
编译 时 刻 未 知 , 但 是 它们 是 这 个 过 程 的 局 部 对 象 , 因而 可 以 被 分 配 在 运行 时 刻 栈 中 。 在 现代 程序 
设计 语言 中 , 在 编译 时 刻 不 能 决定 大 小 的 对 象 将 被 分 配 在 堆 区 。 堆 区 的 存储 结构 将 在 7.4 节 中 讨 
论 。 不 过 , 也 可 以 将 未 知 大 小 的 对 象 、 数组 以 及 其 他 结构 分 配 在 栈 中。 我 们 在 这 里 将 讨论 如 何 进 
行 这 种 分 配 。 尽 可 能 将 对 象 放置 在 栈 区 的 原因 是 我 们 可 以 避免 对 它们 的 空间 进行 垃圾 回收 , 也 
就 减少 了 相应 的 开销 。 注 意 , 只 有 一 个 数据 对 象 局 限于 某 个 过 程 , 目 当 此 过 程 结束 时 它 变 得 不 可 
访问 ， 才 可 以 使 用 栈 为 这 个 对 象 分 配 空间 。 

为 变 长 数组 ( 即 其 大 小 依赖 于 被 调用 过 程 的 一 个 或 多 个 参数 值 的 数组 ) 分 配 空 间 的 一 个 常用 
策略 如 图 7-8 所 示 。 同 样 的 方案 可 以 用 于 任何 类 型 的 对 象 的 分 配 ,只 要 它们 对 被 调用 的 过 程 而 计 
是 局 部 的 ， 并 且 其 大 小 依赖 于 该 次 调用 的 参数 即 可 。 

在 图 7-8 中 , 过 程 有 三 个 局 部 数组 , 我 们 假设 它们 的 大 小 无 法 在 编译 时 刻 确定 。 尽 管 这 些 
数组 的 存储 出 现在 栈 中 , 它们 并 不 是 p 的 活动 记录 的 一 部分。 只 有 指向 各 个 数组 的 开始 位 置 的 指 
针 存放 在 活动 记录 中 。 因 此 当 p 执行 时 , 这些 指 针 的 位 置 相对 于 栈 顶 指针 的 偏 移 量 是 已 知 的 ， 因 
而 目标 代码 可 以 通过 这 些 指针 访问 数组 元 素 。 





被 调用 的 过 程 
9 的 


top_sp 活动 记录 





4 的 数组 
Y- 





top 


图 7-8 访问 动态 分 配 的 数组 
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图 7-8 中 还 给 出 了 一 个 被 p 调用 的 过 程 g 的 活动 记录 5 9 的 这 个 活动 记录 从 7 的 数组 之 后 开 
台 , q 的 所 有 变 长 数组 被 分 配 在 g 的 活动 记录 之 外 。 

对 栈 中 数据 的 访问 通过 指针 top 和 top_sp 完成 。 这 里 , top 标记 了 实际 的 栈 顶 位 置 , 它 指向 下 
一 个 活动 记录 将 开始 的 位 置 , 第 二 个 指针 top_sp 用 来 找到 顶层 活动 记录 的 局 部 的 定 长 字段 。 为 了 
和 图 7-7 保持 一 致 , 我 们 将 假定 top_sp 指向 机 器 状态 字段 的 末端 。 在 图 7-8 H, top_sp 指向 g 的 活 
动 记录 的 机 器 状态 字段 的 末端 。 从 那里 , 我 们 可 以 找到 g 的 控制 链 字段 , 根据 这 个 字段 我 们 可 以 
知道 当 p 位 于 栈 顶 时 , top_sp 所 指 的 p 的 活动 记录 中 的 位 置 。 

重新 设置 top A top sp 所 指 位 置 的 代码 可 以 在 编译 时 刻 生成 。 这 些 代码 根据 将 根据 在 运行 时 刻 
获知 的 记录 大 小 来 计算 top 和 top_sp 的 新 值 。 当 9 返回 时 , 可 以 根据 g 的 活动 记录 中 的 被 保存 的 控 
制 链 来 恢复 top_sp 的 值 。top 的 新 值 等 于 (未 经 恢复 的 原来 的 ) top_sp ERE q 的 活动 记录 中 机 器 状 
AS, 控制 链 . 访问 链 、 IRMA, 参数 字段 (如 图 7-5 所 示 ) 的 总 长 度 。 调 用 者 可 以 在 编译 时 刻 知道 这 个 
KE, 尽管 当 调用 参数 的 个 数 可 变 时 , 它 仍 取决 于 调用 者 (如 果 调 用 g 的 参数 个 数 可 变 ) 。 
7.2.5 7.2 节 的 练习 

练习 7. 2. 1: 假设 图 7-2 中 的 程序 使 用 如 下 的 partition 函数 : 该 函数 总 是 将 al mj] 作为 分 割 值 
vo 同时 假设 在 对 数组 a[m],…,; a[nj 重 新 排序 时 总 是 尽量 保存 原来 的 顺序 。 也 就 是 说 , 首先 是 
以 原 顺序 保持 所 有 小 于 v 的 元 素 , 然后 保存 所 有 等 于 v 的 元 素 , 最 后 按 原来 顺序 保存 所 有 大 于 ， 
的 元 素 。 

1) 画 出 对 数字 9、8、7、6、5、4、3、2、1 进行 排序 时 的 活动 树 。 

2) 同时 在 栈 中 出 现 的 活动 记录 最 多 有 多 少 个 ? 

37.2.2: 当初 始 顺序 为 Js 3.5.7.9, 2.4.6.8, BRAY 7.2.1. 

练习 7. 2.3: 图 7.9 中 是 递归 计算 Fiabonacei 数列 的 


int feint m 可 





C 语言 代码 。 假 设 /的 活动 记录 按 顺序 包含 下 列 元 素 ; GE reid 
回 值 , 参数 n, 局 部 变量 s, 局 部 变量 1) 。 通 常 在 活动 记录 中 if (n < 2) return 1; 
还 会 有 其 他 元 素 。 下 面 的 问题 假设 初始 调用 是 f(5)。 peal 
1) 给 出 完整 的 活动 树 。 return. s+t; 
2) 当 第 1 个 f(1) 调 用 即将 返回 时 , 运行 时 刻 栈 和 其 
中 的 活动 记录 是 什么 样子 的 ? 图 7.9 练习 7.2.3 的 Fibonacci 程序 
! 3) 当 第 5 个 f(1) 调 用 即将 返回 时 , 运行 时 刻 栈 和 
其 中 的 活动 记录 是 什么 样子 的 ? 
练习 7. 2.4: 下 面 是 两 个 C HA KASA g 的 概述 : 
int f(int x) { int i; --- return iti; --- } 


int igGint iy), amt 
也 就 是 说 , 函数 g 调用 /。 画 出 在 g 调用 f 而 f 即将 返回 时 , 运行 时 刻 栈 中 从 g 的 活动 记录 开始 的 
顶端 部 分 。 你 可 以 只 考虑 返回 值 、 参数 、 控 制 链 以 及 存放 局 部 数据 的 空间 。 你 不 用 考虑 存放 的 机 
器 状态 , 也 不 用 考虑 没有 在 代码 中 显示 的 局 部 值 和 临时 值 。 但 是 你 应 该 指出 : 

1) 哪个 函数 在 栈 中 为 各 个 元 素 创 建 了 所 使 用 的 空间 ? 

2) 哪个 函数 写 人 了 各 个 元 素 的 值 ? 

3) 这 些 元 素 属 于 哪个 活动 记录 ? 

练习 7. 2.5: 在 一 个 通过 引用 传递 参数 的 语言 中 , 有 一 个 函数 刀 x, y) 完 成 下 面 的 计算 

IAHE yh Aretura ety; 


如 果 将 a 赋值 为 3, 然后 调用 f(a, a) ,那么 返回 值 是 什么 ? 
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练习 7. 2. 6: C 语言 函数 /的 定义 如 下 : 
int f(int x, *py, **ppz) { 
*eppz += 1; *py += 2; x += 3; return x+*pyt**ppz; 


} 
变量 a 是 一 个 指向 6 的 指针 ; Eb 是 二 个 指向 e 的 指针 ， 而 “是 一 个 当前 值 为 4 的 整数 变量 。 
如 果 我 们 调用 f(c, b, &) ,返回 值 是 什么 ? 


7.3 栈 中 非 局 部 数据 的 访问 


在 未 节 中 ， 我 们 将 探讨 过 程 如 何 访问 它们 的 数据 。 尤其 重要 的 是 找到 在 过 程 P 中 被 使 用 但 又 
不 属于 bp 的 数据 的 机 制 。 对 于 那些 可 以 在 过 程 中 声明 其 他 过 程 的 语言 , 这 种 访问 将 变 得 更 加 复 
杂 。 因 此 , 我 们 首先 从 C 函数 这 种 简单 情况 开始 , 然后 介绍 男 一 种 语言 ML， 该 语言 支持 奶 套 的 
函数 声明 ,并 支持 将 函数 看 成 是 “一 阶 对 象 " 。 也 就 是 说 ,函数 可 以 将 函数 作为 参数 ， 并 把 函数 当 
做 值 返回 。 通 过 修改 运行 时 刻 栈 的 实现 方法 就 可 以 支持 这 种 能 力 。 我 们 将 考虑 几 种 可 选 的 修改 
7.2 节 所 述 的 活动 记录 的 方法 。 
7.3.1 “没有 岩 套 过 程 时 的 数据 访问 

在 C 系列 语言 中 , 各 个 变量 要 么 在 某 个 函数 内 定义 , 要 么 在 所 有 函数 之 外 (全 局 地 ) 定 义 。 
最 重要 的 是 ,不 可 能 声明 一 个 过 程 使 其 作用 域 完全 位 于 另 一 个 过 程 之 内 。 反 过 来 ,一 个 全 局 变量 
o 的 作用 域 包含 了 在 该 变量 声明 之 后 出 现 的 所 有 函数 , 但 那些 存在 标识 符 » 的 局 部 定义 的 地 方 除 
外 。 在 一 个 函数 内 部 声明 的 变量 的 作用 域 就 是 这 个 函数 ,或 者 像 在 1. 6. 3 节 中 讨论 过 的 那样 ， 如 
果 该 函数 具有 嵌 套 的 语句 块 , 这 个 变量 的 作用 域 可 能 是 该 函数 的 部 分 区 域 。 

对 于 不 允许 声明 嵌 套 过 程 的 语言 而 言 , 变量 的 存储 分 配 和 访问 这 些 变 量 是 比较 简单 的 : 

1) 全 局 变量 被 分 配 在 静态 区 。 这 些 变 量 的 位 置 保持 不 变 , 并 且 在 编译 时 刻 可 知 。 因 此 要 访 
问 当 前 正在 运行 的 过 程 的 非 局 部 变量 时 , 我 们 可 以 直接 使 用 这 些 静 态 确定 的 地 址 。 

2) 其 他 变量 一 定 是 栈 顶 活动 的 局 部 变量 。 我 们 可 以 通过 运行 时 刻 栈 的 top_sp 指针 来 访问 这 
些 变量 。 

对 于 全 局 变量 进行 静态 分 配 的 一 个 好 处 是 , 被 声明 的 过 程 可 以 作为 参数 传递 , 也 可 以 作为 结 
果 返 回 (在 C 语言 中 可 以 传递 指向 该 函数 的 指针 )， 实现 这 样 的 传递 不 需要 对 数据 访问 策略 做 出 
本 质 的 改变 。 使 用 语言 的 静态 作用 域 规则 且 不 允许 使 用 嵌 套 过 程 声明 时 ,一 个 过 程 的 任何 非 
局 部 变量 也 是 所 有 过 程 的 非 局 部 变量 , 不 管 这 些 过 程 是 如 何 被 激活 的 。 类 似 地 ,如 果 一 个 过 程 作 
为 结果 返回 , 那么 任何 非 局 部 的 变量 都 指向 为 该 变量 静态 分 配 的 存储 位 置 。 
7.3.2 ”和 骨 套 过 程 相关 的 问题 

当 一 种 语言 允许 嵌 套 地 声明 过 程 并 且 仍 然 遵 循 通常 的 静态 作用 域 规 则 时 ,数据 访问 变 得 
比较 复杂 。 也 就 是 说 , 根据 1. 6. 3 节 中 描述 的 针对 语句 块 的 嵌 套 作用 域 规则 , 一 个 过 程 能 够 访 
间 另 一 个 过 程 的 变量 , 只 要 后 一 个 过 程 的 声明 包含 了 前 一 过 程 的 声明 即 可 。 其 原因 在 于 , 即 
使 在 编译 时 刻 知道 p 的 声明 直接 嵌 套 在 g 之 内 , 我 们 并 不 能 由 此 确定 它们 的 活动 记录 在 运行 时 
刻 的 相对 位 置 。 实 际 上 , 因为 p 或 4 或 者 两 者 都 可 能 是 递归 的 , 在 栈 中 可 能 有 多 个 p 和 /或 4 的 
活动 记录 。 

为 一 个 内 内 过 程 p 中 的 一 个 非 局 部 名 字 % 找 出 对 应 的 声明 是 一 个 静态 的 决定 过 程 , 将 块 结构 
的 静态 作用 域 规则 进行 扩展 就 可 以 解决 这 个 问题 。 假 定 x 在 一 个 外 围 过 程 g 中 声明 。 根据 p 的 一 
个 活动 找到 相关 的 g 的 活动 则 是 一 个 动态 的 决定 过 程 ， 它 需要 额外 的 有 关 活 动 的 运行 时 刻 信息 。 
这 个 问题 的 可 能 解决 方法 之 一 是 使 用 “访问 链 ” ,我 们 将 在 7.3.5 节 中 介绍 这 个 概念 。 
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7.3.3 一 个 支持 幅 套 过 程 声 明 的 语言 
在 C 系列 语言 中 , 还 有 很 多 常见 的 语言 不 支持 嵌 套 的 过 程 , 因此 我 们 介绍 一 种 支持 嵌 套 过 程 
的 语言 。 在 语言 中 支持 艇 套 过 程 的 历史 比较 长 。Alogl 60(C 语言 的 前 身 之 一 ) 就 具备 这 种 能 力 。 
Algol 60 语言 的 后 继 Pascal (一 个 一 度 很 流行 的 教学 语言 ) 也 支持 舱 套 过 程 。 在 较 晚 的 支持 嵌 套 过 
程 的 语言 中 , 最 有 影响 力 的 语言 之 一 是 ML。 我 们 将 通过 这 个 语言 的 语法 和 语义 进行 相关 介绍 
(要 了 解 ML 的 一 些 有 趣 特征 ;请 见 “ML 的 更 多 特性 ”部 分 ) 。 
° ML 是 一 种 函数 式 语言 (funetional language), 这 意味 着 变量 一 旦 被 声明 并 初始 化 就 不 会 再 
改变 。 其 中 只 有 少数 几 个 例外 ， 比 如 数组 的 元 素 可 以 通过 特殊 的 函数 调用 改变 。 
。 定义 变量 并 设 定 它们 的 不 可 更 改 的 初始 值 的 语句 具有 如 下 形式 ， 
val (name) = (expression) 
© 函数 使 用 如 下 语法 进行 定义 ， 
fun (name) ( (arguments) ) = (body) 
© 我 们 使 用 下 列 形 式 的 let 语句 来 定义 函数 体 : 
let (list of definitions) in (statements) end 
其 中 , 定义 (definition) 通 常 是 val 或 fun 语句 。 每 个 这 样 的 定义 的 作用 域 包括 从 该 定义 
之 后 直到 in 为 止 的 所 有 定义 , 以 及 直到 end 为 止 的 所 有 语句 。 最 重要 的 是 ， PRICY LA th 
套 地 定义 。 例 如 ,函数 p 的 函数 体 可 能 包括 一 个 let 语句 ， 而 该 语句 又 包含 了 另 一 个 (其 
套 的 ) 函数 g 的 定义 。 类 似 地 , g 自身 的 函数 体 中 也 可 能 有 函数 定义 , 这 就 形成 了 任意 深 
BEM BBE 
7.3.4 RERE 
APTANA AE AT SE POE, ERATE EEA AR A (nesting depth) 为 1。 例如, 所 有 
C 函数 的 能 套 深度 为 1。 然 而, 如 果 一 个 过 程 p ZE— MR ERE i 的 过 程 中 定义 ， 那么 我 们 设 定 
PR BREN i +1, 
图 7-10 给 出 了 我 们 连续 使 用 的 快速 排序 例子 的 一 个 ML BE PRE, WE ERE 
为 1 的 函数 是 最 外 层 的 函数 sort。 它 读 和 人 一 个 有 9 个 整数 的 数组 a, 并 使 用 快速 排序 算法 对 它们 
进行 排序 。 在 sort 内 部 的 第 二 行 上 定义 了 数组 a 本身。 请 注意 ML 声明 的 形式 。 array 的 第 一 个 
参数 说 明 我 们 要 求 该 数组 具有 11 个 元 素 。 所 有 的 ML 数组 的 下 标 都 是 从 0 开始 的 整数 , 因此 这 
个 数组 与 图 7-2 中 的 C 语言 数组 a 很 相似 。array 的 第 二 个 参数 说 明 数组 a 中 的 所 有 元 素 的 初 
始 值 都 是 0。 因 为 0 是 整数 ,选择 这 样 的 初始 值 使 得 ML 编译 器 推断 出 a 是 一 个 整 型 数组 , 因此 
我 们 就 不 需要 为 a 声明 一 个 类 型 。 





ML 的 更 多 特性 
ML 几乎 是 纯 函 数 式 的 语言 。 除 此 之 外 ,ML 还 具有 多 个 令 那 些 熟悉 C 及 C 系列 语言 的 程 
序 员 感到 惊奇 的 特性 : ， 
© ML 支持 高 阶 函数 (higher-order function) 。 也 就 是 说 ， 一 个 函数 可 以 将 函数 作为 参数 ， 
并 且 能 够 构造 并 返回 其 他 函数 。 而 这 些 函数 又 可 以 将 函数 作为 参数 。 从 而 构造 出 任何 
层次 的 函数 。 
© ML 本 质 上 没有 像 C 中 的 for 和 while 语句 那样 的 迭代 语句 ， 而 是 通过 递归 来 达到 循环 的 
效果 。 这 种 方法 在 一 个 函数 式 语言 中 是 很 重要 的 ， 因为 我 们 不 能 改变 迭代 变量 , 比如 C 
语言 中 的 “for (i =0; i <10; i ++)” 的 i 的 值 。 ML 将 会 把 i 作为 一 个 函数 的 参数 ,该 
区 函数 将 用 不 断 增加 的 ; 值 作为 参数 递归 地 调用 自身 ,直到 到 达 循 环 界限 为 止 。 | 
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© ML 将 列表 和 带 标 号 的 树 结构 作为 其 基本 数据 类 型 。 

。 ML 不 需要 声明 变量 的 类 型 。 准 确 地 说 , 它 在 编译 时 刻 推导 出 类 型 ,并 且 当 它 不 能 推导 
出 结果 时 就 将 其 作为 错误 处 理 。 例 如 , val x =1 显然 使 得 * 具有 整数 类 型 ,并 且 如 果 
我 们 还 看 到 val y =2 * x, 那么 我 们 就 知道 y 也 是 一 个 整数 。 





在 sort 中 声明 的 函数 还 有 : read4rray、exchange 和 quicksort ~ 在 第 (4) 行 和 第 (6) 行 中 , 我 们 说 
明 readArray 和 exchange 都 访问 了 数组 a。 请 注意 , ML 中 的 数组 访 问 可 能 违反 这 个 语言 的 函数 式 
特性 。 就 像 C 版 本 的 quicksort 中 那样 , 这 两 个 函数 实际 上 都 改变 了 a 中 元 素 的 值 。 因 为 这 三 个 函 
数 都 是 直接 在 柑 套 深度 为 1 的 函数 中 定义 的 ， 所 以 它们 的 山 套 深度 都 是 2。 

第 (7) 行 到 第 (11) 行 给 出 了 quicksort 的 一 些 细节 。 局 部 值 v( 即 分 划算 法 的 分 割 值 ) 在 第 8 行 
声明 。 第 (9) 行 则 给 出 了 函数 partition 的 定义 。 在 第 (10) 行 中 我 们 指出 partition 访问 了 数组 a 和 
分 割 值 v， 并 且 还 调用 了 函数 exchange。 因 为 partition 直接 在 嵌 套 深度 为 2 的 函数 中 定义 ， 所 以 其 
周 套 深度 为 3。 第 (11) 行 表明 quicksort 访问 变量 a 和 vw 以 及 函数 partition, 并 递归 调用 其 自身 。 





第 (12) 行 表明 最 外 层 函 数 sore 访问 a, 并 调用 两 个 过 程 readArray 和 quicksort o E] 
ae 
1) fun sort (inputFile, outputFile) = | 
let 
2) vyalua = array (1:0) ; 
3) fun readArray(inputFile) = --- 
4) Caer ts 
5) fun exchange(i,j) = 
6) AS oe Hee 
7) fun quicksort(m,n) = 
let 
8) Val v= un 
9) fun partition(y,z) = 
10) oa Goce My aoe exchange -ni 
in 
11) . dl Gat) wie partition qi quicksort 
end 
in 
12) vss ass: readArray -:- quicksort i- 








end; 


se 


图 7-10 “一 个 使 用 典 套 函数 声明 的 ML 风格 的 quicksort 版 本 








7.3.5 访问 链 

针对 嵌 套 函数 的 通常 的 静态 作用 域 规则 的 一 个 直接 实现 方法 是 在 每 个 活动 记录 中 增加 一 个 
被 称 为 访问 链 ( access link) 的 指针 。 如 果 过 程 p 在 源 代码 中 直接 嵌 套 在 过 程 g 中 , 那么 p 的 任何 
活动 中 的 访问 链 都 指向 最 近 的 q 的 活动 。 请 注意 ,4 的 典 套 深度 一 定 比 p WHERE 1. 
访问 链 形成 了 一 条 链 路 ， 它 从 栈 顶 活动 记录 开始 ,经 过 嵌 套 深度 逐步 递减 的 活动 的 序列 。 沿 着 这 
条 链 路 找到 的 活动 就 是 其 数据 和 对 应 过 程 可 以 被 当前 正在 运行 的 过 程 访问 的 所 有 活动 。 

假定 栈 顶 的 过 程 p HREREE n, Hp 需要 访问 x, 而 x 是 在 某 个 包围 了 REREN n 的 
过 程 g 中 定义 的 一 个 元 素 。 注 意 , mw <n,, 且 仅 当 p 和 4 是 同一 个 过 程 时 两 者 相等 。 为 了 找到 x, 
我 们 从 位 于 栈 顶 的 5 的 活动 记录 开始 , 沿 着 访问 链 进行 n, -n 次 从 一 个 活动 记录 到 男 一 个 活动 
记录 的 查找 , 最终 我 们 找到 了 g 的 活动 记录 。 这 一 定 是 当前 出 现在 在 栈 中 的 最 近 ( 即 最 高 ) 的 4 
的 活动 记录 。 这 个 活动 记录 中 包含 了 我 们 要 找 的 元 素 x*。 因 为 编译 器 知道 活动 记录 的 布局 , 所 以 
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我 们 可 以 根据 最 后 一 个 访问 链 找到 4 的 活动 记录 中 的 某 个 位 置 ， 而 * 就 位 于 和 这 个 位 置 具有 某 个 
固定 偏 移 量 的 位 置 上 。 

RAD 图 7.11 给 出 了 图 7-10 中 的 函数 sor 在 执行 时 可 能 得 到 的 栈 的 序列 。 同 以 前 一 样 , 我 们 
用 函数 名 的 第 一 个 字母 来 表示 函数 。 我 们 展示 了 某 些 可 能 在 不 同 活动 记录 中 出 现 的 数据 , 同时 
显示 了 每 个 活动 的 访问 链 。 在 图 7-11a H, 我们 看 到 的 是 sort 调用 readArray 将 输入 加 载 到 数组 a 
上 后 再 调用 quicksort (1, 9) 对 数组 进行 排序 的 情形 。guicksori(1, 9) 中 的 访问 链 指向 sore 的 活动 记 
K, 这 不 是 因为 sort 调用 了 quicksort, 而 是 因为 在 图 7-10 的 程序 中 , sor 是 qucksort 外 围 的 最 靠近 
它 的 嵌 套 函数 。 





















































: met II net 
i ea ik 访问 链 访问 链 | 访问 链 
Eis ici RNAI HAS ore a 

g(1,9) ate) | Be oa L | 
| 访问 链 | | 访问 链 访问 链 | 访问 链 | 
hi =m Che Me eer ra E eee vo 
p TORE ee E 

访问 链 访问 链 访问 链 
| en a HN ee ro 
b) Loess) | | p1,3) | 
访问 链 | | 芒 间 链 | 

e(1,3) 
Oe Wien eae EE 
| WER | 

d) 


图 7-11 用 来 查找 非 局 部 数据 的 访问 链 


在 图 7-11 所 示 的 连续 步骤 中 , 我 们 看 到 对 quicksort(1, 3) 的 一 次 递归 调用 ， 然后 是 对 partition 
的 调用 , 而 partition 又 调用 exchange, WER, quicksort(1, 3) 的 访问 链 指 向 sort, 其 理由 和 quick- 
sort(1, 9) 的 访问 链 指向 sort 的 理由 相同 。 

在 图 7-11d t}, exchange 的 访问 链 绕 过 了 quicksort 和 partition 的 活动 记录 , 因为 exchange 直接 
REE sort 中 。 这 种 安排 是 合理 的 , 因为 exchange 只 需要 访问 数组 a, 而 它 要 对 换 的 两 个 元 素 由 
其 参数 i 和 j 指定 。 图 
7. 3.6 处 理 访问 链 

如 何 确定 访问 链 呢 ? 当 一 个 过 程 调用 另 一 个 特定 的 过 程 ， 而 被 调用 过 程 的 名 字 在 此 次 调用 
中 明确 给 出 , 那么 处 理 方法 就 很 简单 。 更 复杂 的 情况 是 当 调用 的 对 象 是 一 个 过 程 型 参数 的 时 候 。 
在 那 种 情况 下 , 要 在 运行 时 刻 才能 知道 被 调用 的 是 哪个 过 程 ， 因此 在 这 个 调用 的 不 同 执行 中 , 被 
调用 过 程 的 嵌 套 深度 可 能 有 所 不 同 。 因 此 , 让 我 们 首先 考虑 当 一 个 过 程 q 显 式 地 调用 过 程 p 时 会 
发 生 什 么 事情 。 有 三 种 情况 : 

1) 过 程 p 的 嵌 套 深度 大 于 4 RERE, 那么 p 一 定 是 直接 在 g 中 定义 的 , 否则 g 调 用 p 的 
位 置 就 不 可 能 位 于 过 程 名 p 的 作用 域内 。 因 此 , p 的 山 套 深度 恰好 比 g 的 柑 套 深度 大 1, 而 p 的 访 
问 链 一 定 指向 g。 这 个 问题 很 简单 ， 只 和 需要 在 调用 代码 序列 中 增加 一 个 步骤 , BIZE p 的 访问 链 中 
放置 一 个 指向 q 的 活动 记录 的 指针 。 这 样 的 例子 包括 sort 对 quicksort 的 调用 ,该 调用 生成 了 
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图 7-11a; 以 及 quicksort 对 partition 的 调用 ， 该 调用 产生 了 图 7-lle。 

2) 这 个 调用 是 递归 的 , 也 就 是 说 p =49。 HA, 新 的 活动 记录 的 访问 链 和 它 下 面 的 活动 记录 
的 访问 链 是 相同 的 。 例 如 quicksort(1, 9) Xt quicksort (1, 3) 的 调用 , 该 调用 形成 了 图 7-11b。 

3) p WRERE n, 小 于 4 WRB no 为 了 使 q 中 的 调用 位 于 名 字 p 的 作用 域 中 , 过 程 g 
必定 嵌 套 在 某 个 过 程 r 中 , 而 p 是 一 个 直接 在 r 中 定义 的 过 程 。 因 此 ， Ma 的 活动 记录 开始 , 沿 着 
访问 链 经 过 no ntl 步 就 可 以 找到 栈 中 最 高 的 7 的 活动 记录 。 那 么 , p 的 访问 链 必须 指向 7 的 
这 个 活动 记录 。 
作为 情况 3 的 一 个 例子 , 请 注意 我 们 是 如 何 从 图 7-11le 转变 为 图 7-11d 的 。 被 调用 函数 
exchange 的 绊 套 深度 为 2， 比 调用 函数 partition 的 嵌 套 深度 3 少 1。 因 此 ， FRITA partition 的 活动 
记录 开始 , 前 进 3 -2+1=2 个 访问 链 , 这 使 我 们 从 partition 的 活动 记录 到 达 quicksort(1, 3) 的 活 
动 记录 , 再 到 sort 的 活动 记录 。 因 此 ， exchange 的 访问 链 指 向 sort 的 这 个 活动 记录 , 这 就 是 我 们 在 
图 7-11d 中 看 到 的 。 

另 一 种 等 价 的 找到 这 个 访问 链 的 方法 是 沿 着 访问 链 前 进 n -nn 步 , 并 拷贝 在 那个 活动 记录 
中 找到 的 访问 链 。 在 我 们 的 例子 中 , 我 们 将 经 过 一 步 到 达 quicksort(1, 3) 的 活动 记录 ,并 拷贝 出 
它 的 指向 sort 的 访问 链 。 请 注意 , 这 个 访问 链 对 于 exchange 来 说 是 正确 的 , 尽管 exchange 不 在 
quicksort 的 作用 域 中 , 这 两 个 函数 是 峰 套 在 sort 中 的 兄弟 函数 。 Oo 
7.3.7 过程 型 参数 的 访问 链 

当 一 个 过 程 p 作为 参数 传递 给 另 一 个 过 程 g, 并 且 g 随后 调用 了 这 个 参数 (因此 也 就 在 4 的 这 
个 活动 中 调用 了 站 ,有 可 能 并 不 知道 p 在 程序 中 出 现时 的 上 下 文 。 如 果 是 这 样 ,gq 就 不 可 能 知 
道 如 何 为 p 设 定 访问 链 。 这 个 问题 的 解决 办 法 如 下 : 当 过 程 被 用 作 参 数 的 时 候 ， 调用 者 除了 传递 
过 程 参数 的 名 字 , 同时 还 需要 传递 这 个 参数 对 应 的 正确 的 访问 链 。 

调用 者 总 是 知道 这 个 访问 链 , 因为 如 果 p 被 过 程 r 当 作 一 个 实在 参数 传递 , 那么 p 必然 是 一 
个 可 以 被 > 访问 的 名 字 。 因 此 , r 可 以 像 直接 调用 p 那样 为 p 确定 访问 链 。 也 就 是 说 ， 我 们 使 用 
7.3.6 节 中 给 出 的 有 关 构 造访 问 链 的 规则 。 

在 图 7-12 中 , 我 们 看 到 一 个 ML 函数 a 的 大 [fun aw = 
(HR, Co PRETKA b Alc, MBC DAMA ane 


为 函数 的 参数 /, DAT RAS. ee 在 它 自身 中 for ARTEN 
定义 了 二 个 函数 d, 然后 c 用 实在 参数 4 HHT bo tun TA 5 

让 我 们 分 析 _… 下 在 执行 a 的 时 候 发 生 了 什么 事情 。 ors 
首先 , a。 调用。, 因此 我 们 在 栈 中 将 的 活动 记录 放 在 a in 


++ b(d) ……， 


的 活动 记录 之 上 。 因 为 c 是 直接 在 a 中 定义 的 , 所 以 e | 
的 访问 链 指向 a 的 记录 。 然 后 c 调 用 5(d)。 调 用 代码 i 
序列 设置 了 4 的 活动 记录 , 如 图 7-13a 所 示 。 

在 这 个 活动 记录 中 有 实在 参数 4 和 它 的 访问 链 , 两 
者 结合 组 成 了 的 活动 记录 中 的 形式 参数 了 的 值 。 请 注 ， 图 7-12 ”使 用 函数 参数 的 ML 程序 的 概要 
意 , c 了 解 d 的 信息 , 因为 d 是 在 c 中 定义 的 , 因而 e 传递 了 一 个 指向 它 自 己 的 活动 记录 的 指针 作 
为 a 的 访问 链 。 不 管 d 在 哪里 定义 , 如 果 c 在 该 定义 的 作用 域内 , 那么 必然 适用 7.3. 6 节 中 的 三 





@ ML 支持 相互 递归 调用 的 函数 , 这 种 情况 可 以 用 同样 的 方式 处 理 。 
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条 规则 之 一 , 因此 。 可 以 给 出 这 个 访问 链 。 




















o 
a a 
T ) a | 
访问 链 访问 链 
(a | | ee i 
sa n. eRe a 
be | nie 
f laaa feda 
a) Lus a a 
-访问 链 | 











b) 
图 7-13 带 有 它们 自己 的 访问 链 的 实在 参数 


现在 让 我 们 看 一 下 函数 上 所 做 的 工作 。 我 们 知道 它 将 在 某 个 点 上 使 用 它 的 参数 ,其 效果 就 
是 调用 了 d。 如 图 7-13b 所 示 , d 的 一 个 活动 记录 出 现在 栈 中 。 应 该 放 在 这 个 活动 记录 中 的 正确 
的 访问 链 可 以 在 参数 /的 值 中 找到 。 该 访问 链 指向 e 的 活动 记录 , 因为 c 就 在 d 的 定义 的 外 围 。 
请 注意 , b 能 够 正确 地 设置 这 个 访问 链 , 尽管 5 不 在 c 的 定义 的 作用 域内 。 回 
7.3.8 显示 表 

使 用 访问 链 的 方法 来 访问 非 局 部 数据 的 问题 之 一 是 , MRR EK, 我 们 就 必须 沿 着 一 
段 很 长 的 访问 链 路 才能 找到 需要 的 数据 。 一 个 更 高 效 的 实现 方法 是 使 用 一 个 称 为 显示 表 (dis- 
play) 的 辅助 数组 d, 它 为 每 个 嵌 套 深度 保存 了 一 个 指针 。 我 们 设法 使 得 在 任何 时 刻 , 指针 dL id 
向 栈 中 最 高 的 对 应 于 某 个 嵌 套 深度 为 奔 的 过 程 的 活动 记录 。 图 7-14 给 出 了 一 个 显示 表 的 例子 。 
例如 , 在 图 7-14d H, 我 们 看 到 显示 表 d 的 元 素 d[L 1] 保 存 了 一 个 指向 sore 的 活动 记录 的 指针 , 该 
活动 记录 是 最 高 的 (也 是 唯一 的 ) 对 应 于 某 个 柑 套 深度 为 1 的 函数 的 活动 记录 。 同 时 , d[2] 保 存 
了 指向 exchange 的 活动 记录 的 指针 , 该 记录 是 典 套 深度 为 2 的 最 高 活动 记录 。d[3] 指 向 parti- 
tion, BREEN 3 的 最 高 活动 记录 。 

使 用 显示 表 的 优势 在 于 如 果 过 程 p 正在 运行 , 且 它 需 要 访问 属于 某 个 过 程 g 的 元 素 x, 那么 
我 们 只 需要 查看 di] Bay, 其 中 , i 是 g 的 散 套 深度 。 我 们 沿 着 指针 d[ 引 找到 4g 的 活动 记录 , 根 
据 已 知 的 偏 移 量 就 可 以 在 这 个 活动 记录 中 找到 x。 编译 器 知道 i 的 值 , 因此 它 可 以 产生 代码 , 该 
代码 根据 dL i] A x 相对 于 4 的 活动 记录 顶部 的 偏 移 量 来 访问 x。 因 此 , 该 代码 不 需要 经 过 一 段 很 
长 的 访问 链 路 。 

为 了 正确 地 维护 显示 表 , 我 们 需要 在 新 的 活动 记录 中 保存 显示 表 条 目的 原来 的 值 。 如 果 蔡 
套 深 度 为 n, 的 过 程 p 被 调用 , 并 且 它 的 活动 记录 不 是 栈 中 的 对 应 于 某 个 深度 为 几 的 过 程 的 第 一 
个 活动 记录 , 那么 p 的 活动 记录 就 需要 保存 din, ] 原 来 的 值 , 同时 din, ] 本 身 则 被 设 定 指向 p 的 
这 个 活动 记录 。 当 p 返回 上 且 它 的 这 个 活动 记录 从 栈 中 清除 时 , 我 们 将 d[n,] 恢 复 到 对 p 的 这 次 调 
用 之 前 的 值 。 
图 7-14 给 出 了 操作 显示 表 的 若干 步骤 。 在 图 7-14a H, 深度 为 1 的 sor 调用 了 深度 为 2 
的 quicksort(1, 9) o quicksort 的 活动 记录 中 有 一 个 用 于 存放 d[2] 的 原 值 的 位 置 , 图 中 显示 为 “ 保 
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存 的 d[ 2)”, 尽管 在 这 个 例子 中 因为 之 前 没有 深度 为 2 的 活动 记录 , 这 个 指针 为 空 。 
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图 7-14 维护 显示 表 


在 图 7-14b t} , quicksort(1 , 9) 调 用 quicksort(1, 3) 。 因 为 这 两 次 调用 的 活动 记录 的 深度 都 为 
2, 所 以 我 们 必须 首先 将 d[2] 中 指向 quicksort(1, 9) 的 指针 保存 到 quicksort(1, 3) 的 活动 记录 中 
去 。 然 后 d[2] 被 设置 为 指向 quicksort(1, 3)。 

下 一 步调 用 partition。 这 个 函数 的 肉 套 深度 为 3， 因此 我 们 将 首次 使 用 显示 表 中 的 d[3] 位 
置 ,并 使 它 指向 partition 的 活动 记录 。partition 的 记录 中 有 一 个 存放 原来 的 d[3] 值 的 位 置 。 但 是 
在 这 个 例子 中 , d[3] 原先 没有 值 , 因此 这 个 位 置 上 的 指针 为 空 。 此 时 的 显示 表 和 栈 如 图 7-14c 
所 示 。 

然后 , partition 调用 exchange, PRIX exchange 的 嵌 套 深度 为 2, 因此 它 的 活动 记录 保存 了 旧 的 
d[2] 指 针 ， 即 指向 quicksort(1, 3) 的 活动 记录 的 指针 。 请 注意 , 这 里 出 现 了 多 个 显示 表 指 针 之 间 
相互 交叉 的 情况 。 也 就 是 说 , d[3] 指 向 的 位 置 比 a[2] 所 指 位 置 更 低 。 这 是 一 个 正常 的 情况 , A 
为 exchange 只 访问 它 自己 的 数据 和 通过 d[1] 访 问 的 sort 的 数据 。 O 
7.3.9 7.3 HAY 

练习 7. 3. 1: 图 7-15 中 给 出 了 一 个 按照 非 标准 方式 计算 Fibonacci 数 的 ML 语言 的 函数 
main, PRAM fibo 将 计算 第 nn 个 Fibonacci 数 (2 三 0) HASTE fibo 中 的 是 fibi, 它 假 设 n=S2 
并 计算 第 nn 个 Fibonacci $t, WEHE fibl 中 的 是 fib2, 它 假设 "三 4。 请 注意 , tibl 和 fib2 都 
不 需要 检查 基本 情况 。 我 们 考虑 从 对 main 的 调用 开始 , 直到 (对 fib0(1) 的 ) 第 一 次 调用 即将 
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返回 的 时 段 , 请 描述 出 当时 的 活动 记录 栈 , 并 给 出 栈 中 的 各 个 活动 记录 的 访问 链 。 
练习 7. 3. 2: 假设 我 们 使 用 显示 表 来 实现 图 7-15 中 的 函数 。 请 给 出 对 fib0(1 ) 的 第 一 次 调 
用 即将 返回 时 的 显示 表 。 同 时 指明 那 时 在 栈 中 的 各 个 活动 记录 中 保存 的 显示 表 条 目 。 








fun main () { 
let 
fun fib0(n) = 
let 
fun fibi(n) = 

let 
fun fib2(n). = fibl(n-1) + fibi@-2) 

in 
if n >= 4 then fib2(n) 


else fibO0(n-1) + fib0(n-2) 
end 


in 
if n >= 2 then fibt G) 
else i 
end 
in 
fib0(4) 
end; 





图 7-15 it@ Fibonacci HARE AL 


7.4 HFR 


堆 是 存储 空间 的 一 部 分 , 它 被 用 来 存储 那些 生命 周期 不 确定 , 或 者 将 生存 到 被 程序 显 式 删 除 
为 止 的 数据 。 虽 然 局 部 变量 通常 在 它们 所 属 的 过 程 结束 之 后 就 变 得 不 可 访问 , 但 很 多 语言 支持 
创建 某 种 对 象 或 其 他 数据 , 它们 的 存在 与 否 和 创建 它们 的 过 程 的 活动 无 关 。 例 如 , C ++ 和 Java 
语言 都 为 程序 员 提 供 了 new 语句 , 该 语句 创建 的 对 象 (或 指向 对 象 的 指针 ) 可 以 在 过 程 之 间 进 行 
传递 ,因此 这 些 对 象 在 创建 它们 的 过 程 结束 之 后 仍然 可 以 长 期 存在 。 这 样 的 对 象 被 存放 在 堆 区 。 

在 本 节 中 , 我 们 将 讨论 存储 管理 器 (memory manager) ， 即 分 配 和 回收 堆 区 空间 的 子 系统 , 它 
是 应 用 程序 和 操作 系统 之 间 的 一 个 接口 。 对 于 C 或 C++ 这 样 需要 手动 回收 存储 块 的 语言 ( 即 通 
过 程序 中 的 显 式 语 句 ， 比 如 free 或 delete, 进行 回收 ) 而 言 , 存储 管理 器 还 负责 实现 空间 
回收 。 

我 们 将 在 7. 5 节 中 讨论 垃圾 回收 (garbage collection) ， 即 在 堆 区 中 找到 那些 不 再 被 程序 使 用 、 
因此 可 以 被 重新 分 配 以 便 存 放 其 他 数据 项 的 空间 的 过 程 。 对 于 Java 这 样 的 语言 , 内 存 的 回收 是 
由 垃圾 回收 器 完成 的 。 在 需要 进行 垃 瓜 回收 时 ,垃圾 回收 器 是 存储 管理 器 的 一 个 重要 子 系统 。 
7.4.1 存储 管理 器 
存储 管理 器 总 是 跟踪 堆 区 中 的 空闲 空间 。 它 具有 两 个 基本 的 功能 ; 

。 分 配 。 当 程序 为 一 个 变量 或 对 象 请 求 内 存 时 5 , 存储 管理 器 产生 一 段 连续 的 具有 被 请 求 

大 小 的 堆 空间 。 如 果 有 可 能 , 它 使 用 堆 中 的 空闲 空间 来 满足 分 配 请 求 ; 如 果 没 有 被 请 求 
大 小 的 空间 块 可 供 分 配 , 它 试图 从 操作 系统 中 获得 连续 的 虚拟 内 存 来 增加 堆 区 的 存储 空 





日 在 后 面 的 内 容 中 , 我 们 将 把 需要 内 存 空间 的 事物 称 为 “对 象 ”"， 尽管 它 们 并 不 是 “面向 对 象 程序 设计 ”意义 上 的 真 
正 对 象 。 
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间 。 如 果 空 间 已 经 用 完 , 存储 管理 器 将 空间 耗 尽 的 信息 传 回 给 应 用 程序 。 
e 回收 。 存 储 管理 器 把 被 回收 的 空间 返还 到 空闲 空间 的 缓冲 池 中 , 这 样 它 可 以 复 用 该 空间 
来 满足 其 他 的 分 配 请 求 。 存 储 管理 器 通常 不 会 将 内 存 返 回 给 操作 系统 ， 即 使 当 这 个 程序 
不 再 需要 那么 多 的 堆 空 间 时 也 不 会 归还 给 操作 系统 s 
WR FERCA), (b) 两 个 条 件 都 成 立 , 内 存 的 管理 就 会 相对 简单 : (a) 所 有 分 配 请 求 都 要 求 
相同 大 小 的 存储 块 ，(b) 存储 空间 按照 可 预见 的 方式 被 释放 , 比如 先 分 配 先 回收 。 对 于 有 些 语 言 
(比如 Lisp) 而 言 条 件 a 成 立 。 纯 的 Lisp 语言 只 使 用 一 种 数据 元 素 一 一 一 个 双 指 针 单 元 , 所 有 的 
数据 结构 都 在 该 元 素 的 基础 上 构建 。 条 件 b 在 某 些 情况 下 也 可 能 成 立 , 最 常见 的 情况 是 可 以 在 
运行 时 刻 栈 中 分 配 的 数据 。 然 而 , 对 于 大 部 分 的 语言 而 言 , 这 两 个 条 件 一 般 都 不 成 立 。 相 反 地 ， 
我 们 需要 为 不 同 大 小 的 数据 元 素 分 配 空间 , 并 且 没 有 好 方法 可 以 预测 所 有 已 分 配对 象 的 生命 期 。 
因此 , 存储 管理 器 必须 准备 以 任何 顺序 来 处 理 任何 大 小 的 空间 分 配 和 回收 请 求 。 这 些 请 求 
小 到 一 个 字 节 , 大 到 该 程序 的 整个 地 址 空间 。 
下 面 是 我 们 期 望 存储 管理 器 具有 的 特性 : 
。 空间 效率 。 存 储 管理 器 应 该 能 够 使 一 个 程序 所 需 的 堆 区 空间 的 总 量 达到 最 小 。 这 样 做 就 
可 以 在 一 个 固定 大 小 的 虚拟 地 址 空间 中 运行 更 大 的 程序 。 空 间 效率 是 通过 使 存储 碎片 达 
到 最 少 而 得 到 的 ,该 技术 将 在 7.4.4 节 中 讨论 。 
© 程序 效率 。 存 储 管理 器 应 该 充分 利用 存储 子 系统 ， 使 程序 可 以 运行 得 更 快 。 我 们 将 在 
7.4.2 节 中 看 到 , 根据 数据 对 象 在 存储 中 所 处 的 不 同位 置 , 执行 一 条 指令 所 花费 的 时 间 可 
能 相差 很 大 。 幸 运 的 是 , 程序 通常 会 表现 出 “局 部 性 ”, 7.4.3 节 将 讨论 这 种 现象 , 它 指 的 
是 通常 的 程序 在 访问 内 存 时 具有 的 非 随机 性 聚集 的 特性 。 通 过 关注 对 象 在 存储 中 的 放置 
方法 , 存储 管理 器 可 以 更 好 地 利用 空间 ,并且 有 希望 使 程序 运行 得 更 快 。 
e 低 开 销 s 因为 存储 分 配 和 回收 在 很 多 程序 中 是 常用 的 操作 ,因此 使 得 这 些 操 作 尽 可 能 地 
高 效 是 非常 重要 的 。 也 就 是 说 , 我 们 希望 最 小 化 开销 (overhead) ， 即 花费 在 分 配 和 回收 上 
的 执行 时 间 在 总 运行 时 间 中 所 占 的 比例 。 请 注意 , 分 配 的 开销 由 小 型 请 求 决定 , 管理 大 
型 对 象 的 开销 相对 不 重要 ,因为 通常 会 在 它 上 面 执 行 大量 的 计算 , 这 个 开销 被 分 推 了。 
7.4.2 一 台 计算 机 的 存储 层次 结构 
存储 管理 和 编译 器 优化 必须 在 充分 了 解 存储 行为 的 基础 上 完成 。 现 代 机 器 的 设计 使 得 程序 
员 不 需要 考虑 内 存 子 系统 的 细节 就 能 够 写 出 正确 的 程序 。 然 而 , 程序 的 效率 不 仅 取决 于 被 执行 
的 指令 的 数量 ,还 取决 于 执行 其 中 每 条 指令 所 花费 的 时 间 。 不 同情 况 下 执行 一 条 指令 所 花费 的 时 
间 可 能 会 有 明显 的 不 同 , 因为 访问 不 同 的 存储 区 域 所 花费 的 时 间 从 几 纳 秒 到 几 毫 秘 不 等 。 因 此 ， 
数据 密集 型 程序 可 以 从 能 够 充分 利用 存储 子 系统 的 优化 技术 中 得 到 很 大 的 好 处 。 我 们 将 在 7.4. 3 
节 看 到 ， 这 种 优化 可 以 利用 程序 的 “局 部 性 "现象 , 即 一 般 程序 的 非 随机 行为 。 
内 存 访问 时 间 上 的 巨大 差异 源 于 硬件 技术 的 根本 性 局 限 。 我 们 可 以 制造 出 一 个 小 而 快 的 存 
储 器 件 或 者 大 而 慢 的 存储 器 件 , 但 是 无 法 制造 出 既 大 又 快 的 存储 器 件 。 现 在 , 制造 一 个 具有 纳 秒 
级 访问 时 间 的 千 兆 容量 的 存储 器 件 仍然 是 不 可 能 的 ,而 纳 秒 级 正 是 高 性 能 处 理 器 的 运行 速度 ， 
因此 , 在 实践 中 , 现代 计算 机 都 以 存储 层次 结构 (memory hierarchy) 的 方式 安排 它们 的 存储 。 如 图 
7-16 所 示 的 一 个 存储 层次 结构 由 一 系列 存储 元 素 组 成 , 较 小 较 快 的 元 素 “ 更 加 接近 ”处 理 嚣 ， 较 
大 但 较 慢 的 元 素 则 离 存储 器 比较 远 。 
一 个 处 理 器 通常 具有 人 少量 寄存 器 ,寄存 器 中 的 内 容 由 软件 控制 。 然 后 , 它 具 有 一 层 或 多 层 高 
速 缓存 ,这些 高 速 缓存 通常 使 用 静态 RAM 制造 ， 其 大 小 从 几 千 字 节 到 几 兆 字 节 不 等 。 层 次 结构 
中 的 下 一 层 是 物理 ( 主 ) 内 存 , 它 由 数 百 兆 到 几 千 兆 的 动态 RAM 构成 。 物 理 内 存 由 下 一 层 的 虚拟 
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内 存 提供 支持 , 虚拟 内 存 由 几 千 兆 字 节 的 磁盘 实现 。 在 一 次 内 存 访问 中 , 机 器 首先 在 最 近 ( 最 底 
层 的 ) 的 存储 中 寻找 数据 ,， 如果 数据 不 在 那里 则 到 上 一 层 中 寻找 , 以 此 类 推 。 




















典型 的 大 小 典型 的 访问 时 间 
> 2GB | 虚拟 内 存 (磁盘 ) | 3~15 ms 
256MB ~2GB 物理 内 存 100 一 150 ns 
128KB~4MB 二 级 高 速 缓存 40 一 60 ns 
| = 
16~64KB 一 级 高 速 缓存 5~10 ns 
32 个 机 器 字 寄存 器 (处理 器 ) 1 ns 





7-16， 典 型 的 内 存 层次 结构 的 配置 


寄存 器 个 数 很 少 ,因此 寄存 器 的 使 用 会 根据 特定 应 用 进行 裁剪 ,并 由 编译 器 生成 的 代码 进行 
管理 。 存 储 层次 结构 中 的 所 有 其 他 层 都 是 自动 管理 的 。 这 样 做 不 仅 简 化 了 编程 任务 ,并 且 相同 
的 程序 可 以 在 具有 不 同 存储 配置 的 机 器 上 高 效 工作 。 对 于 每 次 存储 访问 , 机 器 从 最 低层 开始 逐 
层 搜索 每 一 层 存储 ,直到 找到 数据 为 止 。 高 速 缓存 是 完全 通过 硬件 进行 管理 的 , 这 么 做 是 为 了 能 
够 跟 上 相对 较 快 的 RAM 访问 时 间 。 因 为 磁盘 访问 速度 相对 较 慢 , 虚拟 内 存 是 由 操作 系统 进行 管 
理 的 , 辅 以 一 个 称 为 “转换 劳 视 缓冲 ”的 硬件 结构 。 
数据 以 连续 存储 块 的 方式 进行 传输 。 为 了 分 摊 访 问 的 开销 , 内 存 层次 结构 中 较 慢 的 层次 通 
常 使 用 较 大 的 块 。 在 主 存 和 高 速 缓存 之 间 的 数据 是 按照 被 称 为 高 速 缓 存 线 (cache line) 的 块 进行 
传输 的 , 高 速 缓存 线 的 长 度 通常 在 32 ~ 256 字 节 之 间 。 在 虚拟 内 存 ( 硬盘) 和 主 内 存 之 间 的 数据 
是 以 被 称 为 “页 ”(page) 的 内 存 块 进行 传输 的 ， 页 的 大 小 通常 在 4 ~64 KB 之 间 。 
7.4.3 程序 中 的 局 部 性 
大 部 分 程序 表现 出 高 度 的 局 部 性 (locality), 也 就 是 说 , 程序 的 大 部 分 运行 时 间 花 费 在 相对 较 
小 的 一 部 分 代码 中 , 此 时 它们 只 涉及 少 部 分 数据 。 如 果 一 个 程序 访问 的 存储 位 置 很 可 能 将 在 一 
个 很 短 的 时 间 段 内 被 再 次 访问 , 我 们 就 说 这 个 程序 具有 时 间 局 部 性 (temporal locality) 。 如 果 被 访 
问 过 的 存储 位 置 的 临近 位 置 很 可 能 在 一 个 很 短 的 时 间 段 内 被 访问 , 我 们 就 说 这 个 程序 具有 空间 
局 部 性 (spatial locality) 。 
通常 认为 程序 把 90% 的 时 间 用 来 执行 10% 的 代码 。 原 因 如 下 : 
。 程序 经 常 包含 很 多 从 来 不 会 被 执行 的 指令 。 使 用 组 件 和 库 构 建 得 到 的 程序 只 使 用 了 它们 
提供 的 一 小 部 分 功能 。 同时; 随 着 需求 的 改变 和 程序 的 演化 , 遗留 系统 中 常常 包含 很 多 
不 再 被 使 用 的 指令 。 
o 在 程序 的 一 次 典型 运行 中 , 可 能 被 调用 的 代码 中 只 有 一 小 部 分 会 被 实际 执行 。 例 如 , 虽 
然 处 理 非法 输入 和 异常 情况 的 指令 对 于 程序 的 正确 性 是 至 关 重 要 的 , 但 是 它们 在 某 次 运 
行 中 很 少 会 被 调用 。 
。 通常 的 程序 往往 将 大 部 分 时 间 花 费 在 执行 程序 中 的 最 内 层 循环 和 最 紧凑 的 递归 环 上 。 
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静态 的 和 动态 的 RAM 

大 部 分 随机 访问 内 存 是 动态 的 (dynamic), 这 意味 着 它们 是 由 简单 的 电子 电路 构成 的 。 
这 些 电路 会 在 短 时 间 内 丢失 电位 (因此 也 就 会 “忘记 ”它们 原本 存储 的 比特 值 )。 这 些 电 路 需 
要 定期 刷新 , 即 读 出 然后 重新 写 人 它们 的 比特 。 男 一 方面 , 在 静态 ( static) RAM 的 设计 中 , 每 
个 比特 都 需要 一 个 更 复杂 的 电路 , 结果 是 存储 在 其 中 的 比特 值 可 以 保持 任意 长 时 间 , 直到 它 
被 改写 为 止 。 显 然 , 一 个 芯片 使 用 动态 RAM 电路 可 以 比 使 用 静态 RAM 电路 存储 更 多 的 比 
特 。 因 此 我 们 通常 会 看 到 动态 RAM 类 型 的 大 容量 主 存 , 而 像 高 速 缓存 这 样 的 较 小 存储 则 使 
用 静态 电路 构造 。 


局 部 性 使 得 我 们 可 以 充分 利用 如 图 7-16 所 示 的 现代 计算 机 的 存储 层次 结构 。 将 最 常用 的 指 
令 和 数据 放 在 快 而 小 的 存储 中 , 而 将 其 余部 分 放 入 慢 而 大 的 存储 中 , 我 们 就 可 以 显著 地 降低 一 个 
程序 的 平均 存储 访问 时 间 。 

人 们 已 经 发 现 , 很 多 程序 在 对 指令 和 数据 的 访问 方式 上 既 表 现 出 时 间 局 部 性 , 又 表现 出 空间 
局 部 性 。 然 而 , 数据 访问 模式 通常 比 指令 访问 模式 表现 出 更 大 的 多 样 性 。 将 最 近 使 用 的 数据 放 
在 最 快 的 存储 层次 中 的 策略 可 以 在 普通 程序 中 发 挥 很 好 的 作用 , 但 是 在 某 些 数据 密集 型 程序 中 
的 作用 并 不 明显 一 一 循环 遍历 非常 大 的 数组 的 程序 就 是 这 样 的 例子 。 

仅仅 通过 查看 代码 , 我 们 一 般 无 法 看 出 哪 部 分 代码 会 被 频繁 地 用 到 , 针对 特定 输入 指出 这 一 
点 则 更 加 困难 。 即 使 我 们 知道 哪些 指令 会 被 频繁 执行 , 最 快 的 高 速 缓存 通常 也 不 能 够 同时 存储 
这 些 指令 。 因 此 , 我 们 必须 动态 调整 最 快 的 存储 中 的 内 容 , 用 它们 来 保存 可 能 很 快 会 被 频繁 使 用 
的 指令 。 

利用 存储 层次 结构 的 优化 

将 最 近 使 用 过 的 指令 放 入 高 速 缓存 的 策略 通常 很 有 效 。 换 句 话 说 , 过 去 的 情况 能 够 很 好 地 
预测 将 来 的 存储 使 用 情况 。 当 一 条 新 的 指令 被 执行 时 , 其 下 一 条 指令 也 很 有 可 能 将 被 执行 。 这 
种 现象 是 空间 局 部 性 的 一 个 例子 。 提 高 指令 的 空间 局 部 性 的 一 个 有 效 技术 是 让 编译 器 把 很 可 能 
连续 执行 的 多 个 基本 块 ( 即 总 是 顺序 执行 的 指令 序列 ) 连续 存放 , 即 放 在 同一 个 存储 页 面 中 , 可 
能 的 话 甚至 放 在 同一 高 速 缓存 线 中 。 属 于 同一 个 循环 或 同一 个 函数 的 指令 很 有 可 能 被 一 起 
运行 9 。 

我 们 还 可 以 改变 数据 布局 或 计算 顺序 ， 从 而 改 进 一 个 程序 中 的 数据 访问 的 时 间 局 部 性 和 空间 局 
部 性 。 例 如 , 一 些 程序 反复 地 访问 大 量 数据 , 而 每 次 访问 只 完成 少量 的 计算 , 这 样 的 程序 的 性 能 不 
会 很 好 。 我 们 可 以 每 次 将 一 部 分 数据 从 存储 层次 结构 的 较 慢 层次 加 载 到 较 快 层次 ( 比如 从 磁盘 移 到 
EF), 并 且 在 这 些 数 据 驻 留 在 较 快 层 中 时 执行 所 有 针对 这 些 数据 的 运算 , 那么 程序 的 性 能 就 会 变 
得 更 好 。 这 个 概念 可 以 递归 地 应 用 于 物理 内 存 、 高 速 缓存 以 及 寄存 器 中 的 数据 的 复 用 。 














高 速 缓存 体系 结构 
我 们 如 何 知 道 一 个 高 速 缓 存 线 在 高 速 缓存 中 呢 ? 逐个 检查 高 速 缓存 中 的 每 一 条 高 速 缓存 
线 过 于 费时 ,因此 在 实践 中 常常 会 限制 一 条 高 速 缓存 线 在 高 速 缓存 中 的 放置 位 置 。 这 个 约束 











O 当 机 器 从 内 存 中 获得 一 个 存储 字 时 ,同时 预 取 (prefetch) 出 其 后 的 多 个 连续 内 存 字 的 开销 相对 较 小 。 因 此 ,一 个 
常见 的 存储 层次 结构 的 特性 是 在 每 次 访问 某 层 存储 的 时 候 会 从 该 层 存储 中 获取 一 个 包含 了 多 个 机 器 字 的 块 。 
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称 为 成 组 相关 性 (set associativity) 。 如 果 在 一 个 高 速 缓存 中 , 一 条 缓存 线 只 能 被 放 在 下 个 位 置 
E, 那么 这 个 高 速 缓存 就 称 为 上 路 成 组 相关 的 (k-way set associative) 。 最 简单 的 高 速 缓存 是 1 
路 相关 高 速 缓存 ， 它 也 称 为 直接 映射 高 速 缓存 ( direct-mapped cache) 。 在 一 个 直接 映射 高 速 组 
存 中 ,存储 地 址 为 n 的 数据 只 能 够 放 在 缓存 地 址 n mod s E, 其 中 * 是 这 个 高 速 缓存 的 大 小 。 
类 似 地 , 一 个 路 成 组 相关 高 速 缓存 被 分 为 个 集合 , 而 一 个 地 址 为 n 的 数据 只 能 映射 到 各 
个 集合 中 的 位 置 n mod (s/k) 上 。 大 部 分 指令 和 数据 高 速 缓存 的 相关 性 在 1~8 之 间 。 如 果 一 
条 缓存 线 被 调 人 高 速 缓存 , 并 且 所 有 可 能 存放 这 个 高 速 缓存 线 的 位 置 都 已 经 被 占用 , 那么 通 
常情 况 下 会 将 最 近 最 少 使 用 的 缓存 线 清 除 出 高 速 缓存 。 














7.4.4 碎片 整理 
在 程序 开始 执行 的 时 候 , 堆 区 就 是 一 个 连续 的 空闲 空间 单元 。 随 着 这 个 程序 分 配 和 回收 存 
储 工作 的 进行 ,空间 被 分 割 成 若干 空闲 存储 块 和 已 用 存储 块 ， 而 空闲 块 不 一 定位 于 堆 区 的 某 个 连 
续 区 域 中 。 我 们 将 空闲 存储 块 称 为 “窗口 ”(hole)。 对 于 每 个 分 配 请 求 , 存储 管理 器 必须 将 请 求 
的 存储 块 放 入 一 个 足够 大 的 “窗口 ”中 。 除 非 找到 一 个 大 小 恰好 相等 的 “窗口 ”, 否则 我 们 必定 会 
切 分 某 个 窗口 ,结果 创建 出 更 小 的 窗口 。 
对 于 每 个 回收 请 求 , 被 释放 的 存储 块 被 放 回 到 空闲 空间 的 缓冲 池 中 。 我 们 把 连续 的 窗口 接 
A (coalesce) 成 为 更 大 的 窗口 ,否则 窗口 只 会 越 变 越 小 。 如 果 我 们 不 小 心 , 空闲 存储 最 终 会 变 成 
Be, 即 大 量 的 细小 且 不 连续 的 窗口 。 此 时 , 就 有 可 能 找 不 到 一 个 足够 大 的 “窗口 ”来 满足 某 个 
将 来 的 请 求 , 尽管 总 的 空闲 空间 可 能 仍然 充足 。 
best-fit 和 next-fit H AE 
我 们 通过 控制 存储 管理 器 在 堆 区 中 放置 新 对 象 的 方法 来 减少 碎片 。 经 验 表 明 , 使 现实 中 的 
程序 中 碎片 最 少 的 一 个 良好 策略 是 将 请 求 的 存储 分 配 在 满足 请 求 的 最 小 可 用 窗口 中 。 这 个 best- 
fit 算法 趋向 于 将 大 的 窗口 保留 下 来 满足 后 续 的 更 大 请 求 。 另 一 种 策略 被 称 为 first-fit。 在 这 个 策 
略 中 ,对象 被 放置 到 第 一 个 ( 即 地 址 最 低 的 ) 能 够 容纳 请 求 对 象 的 窗口 中 。 这 种 策略 在 放置 对 象 
时 花费 的 时 间 较 少 , 但 是 人 们 发 现 它 在 总 体 性 能 上 要 比 best-fit 策略 差 。 
为 了 更 有 效 地 实现 best-fit 放置 策略 , 我们 可 以 根据 空闲 空间 块 的 大 小 , 将 它们 分 在 若干 个 
容 需 中 。 一 个 实际 可 行 的 想法 是 为 较 小 的 尺寸 设置 较 多 的 容器 , 因为 小 对 象 的 个 数 通常 比较 多 。 
例如 , 在 GNU BY C 编译 器 gce 中 使 用 的 存储 管理 器 Lea 将 所 有 的 存储 块 对 齐 到 8 字 节 的 边界 。 对 
于 16 字 节 到 S12 字 节 之 间 的 、 每 个 大 小 为 8 字 节 整数 倍 的 存储 块 , 这 个 存储 管理 器 都 设置 了 一 
个 容器 。 更 大 尺寸 的 容器 按照 对 数值 进行 划分 ( 即 每 个 容器 的 最 小 尺寸 是 前 一 个 容器 的 最 小 尺寸 
的 两 倍 ) 。 在 每 一 个 容器 中 , 存储 块 按照 它们 的 大 小 排列 。 总 是 存在 这 样 一 个 空闲 空间 块 , 存储 
管理 器 可 以 向 操作 系统 请 求 更 多 的 页 面 来 扩展 这 个 块 。 这 个 块 被 称 为 “荒野 块 ”( wildemess 
chunk) 。 因 为 它 的 可 扩展 性 ，Lea 把 这 个 块 当 作 最 大 尺寸 存储 块 的 容器 。 
容器 机 制 使 得 寻找 best-fit 块 变 得 容易 。 
。 如 果 被 请 求 的 尺寸 有 一 个 专 有 容器 , 即 该 容器 只 包含 该 尺寸 的 存储 块 ,我们 可 以 从 该 容 
器 中 任意 取出 一 个 存储 块 。Lea 存储 管理 器 在 处 理 小 尺寸 请 求 时 就 是 这 样 做 的 。 
。 如 果 被 请 求 的 尺寸 没有 专 有 的 容器 , 我 们 可 以 找 出 一 个 能 够 包含 该 尺寸 的 存储 块 的 容器 。 
在 这 个 容器 中 , 我 们 可 以 使 用 first-fit 或 best-fit 策略 。 也 就 是 说 , 我 们 既 可 以 找到 并 选择 
第 一 个 足够 大 的 存储 块 , 也 可 以 花 更 多 的 时 间 去 寻找 最 小 的 满足 需求 的 存储 块 。 注 意 ， 
如 果 选 择 的 空闲 存储 块 的 大 小 不 是 正好 合适 , 通常 将 该 块 的 剩余 部 分 放 到 一 个 对 应 于 更 
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小 尺寸 的 容器 中 。 
。 不 过 , 这 个 目标 容器 可 能 为 空 ,或 者 这 个 容器 中 的 所 有 存储 块 都 太 小 , 不 能 满足 空间 请 
求 。 在 这 种 情况 下 , 我 们 只 需要 使 用 对 应 于 下 一 个 较 大 尺寸 的 容器 重新 进行 搜索 。 最 后 ， 
我 们 要 么 找到 可 以 使 用 的 存储 块 ， 要 么 到 达 “ 荒 野 块 ”。 从 这 个 荒野 块 中 我 们 一 定 可 以 得 
到 需要 的 空间 , 但 有 可 能 需要 请 求 操作 系统 为 堆 区 增加 更 多 的 内 存 页 。 
虽然 best-fit 放置 策略 可 以 提高 空间 利用 率 , 但 从 空间 局 部 性 的 角度 考虑 , 它 可 能 并 不 是 最 
好 的 。 程 序 在 同一 时 间 分 配 的 块 通常 具有 类 似 的 访问 模式 , 并 具有 类 似 的 生命 周期 。 因 此 将 它 
们 放置 在 一 起 可 以 改善 程序 的 空间 局 部 性 。 对 best-fit 算法 的 有 用 改进 之 一 是 在 找 不 到 恰巧 等 于 
请 求 尺寸 的 存储 块 时 ， 使 用 另 一 种 对 象 放置 方法 。 在 这 种 情况 下 , 我 们 使 用 next-fit 策略 ， 只 要 刚 
刚 分 割 过 的 存储 块 中 还 有 足够 的 空间 来 容纳 这 个 对 象 , 我 们 就 把 这 个 对 象 放置 在 这 个 存储 块 中 。 
next-fit 策略 还 可 以 提高 分 配 操作 的 速度 。 
管理 和 接合 空闲 空间 
当 一 个 对 象 通 过 手工 方式 回收 时 ,存储 管理 器 必须 将 该 存储 块 设置 为 空闲 的 ,以 便 它 可 以 被 
再 次 分 配 。 在 某 些 情况 下 , 还 可 以 将 这 个 块 和 堆 中 的 相 邻 块 合并 ( 接合) 起来, 构成 一 个 更 大 的 
块 。 这 样 做 是 有 好 处 的 。 因 为 我 们 总 能 够 用 一 个 大 的 存储 块 来 完成 总 量 相等 的 多 个 小 存储 块 所 
完成 的 工作 , 但 是 不 能 用 很 多 个 小 存储 块 来 保存 一 个 大 对 象 ， 而 合并 后 的 存储 块 就 有 可 能 做 到 。 
如 果 我 们 为 所 有 具有 固定 尺寸 的 存储 块 保留 一 个 容器 , 如 Lea 中 为 小 尺寸 块 所 做 的 那样 , I 
么 我 们 可 能 倾向 于 不 把 相 邻 的 该 尺寸 的 块 合并 成 为 双 倍 大 小 的 块 。 比 较 简单 的 做 法 是 将 所 有 同 
样 大 小 的 块 全 部 按照 需要 放 在 多 个 页 中 , 而 不 必 接合 。 那么 ,一 个 简单 的 分 配 /回收 方案 是 维护 
一 个 位 映射 ,其 中 的 每 个 比特 对 应 于 容器 中 的 一 个 块 。1 代表 该 块 已 被 占用 , 0 表示 它 是 空闲 的 。 
当 一 个 块 被 回收 时 ， 我们 将 它 对 应 的 1 改 为 0。 当 我 们 需要 分 配 一 个 存储 块 时 , 便 找 出 任意 一 个 
相应 比特 为 0 的 块 , 将 这 个 位 改 为 1， 然后 就 可 以 使 用 该 内 存 块 了 。 如 果 没 有 空闲 块 , 我 们 就 获 
取 一 个 新 的 页 , 将 其 分 割 成 适当 大 小 的 存储 块 ,同时 扩展 用 于 存储 管理 的 位 向 量 。 
在 有 些 情况 下 问题 会 变 得 比较 复杂 。 比 如 , 我 们 不 使 用 容器 而 把 堆 区 作为 一 个 整体 进行 管 
理 ; 或 者 我 们 想 要 接合 相 邻 的 块 ， 并 在 必要 的 时 候 将 合并 得 到 的 块 移动 到 另 一 个 容器 中 。 有 两 种 
数据 结构 可 以 用 于 支持 相 邻 空闲 块 的 接合 ， 
。 边界 标记 。 在 每 个 (不 管 是 空闲 的 还 是 已 分 配 的 ) 存储 块 的 高 低 两 端 , 我 们 都 存放 了 重要 
的 信息 。 在 块 的 两 端 都 设置 了 一 个 free/used 位 ， 用 来 标识 当前 该 块 是 已 用 的 (used) 还 是 
空闲 的 (free) 。 在 与 每 一 个 free/used 位 相 邻 的 位 置 上 存放 了 该 块 中 的 字 节 总 数 。 
一 个 双重 链接 的 、 谍 入 式 的 空闲 列表 。 各 个 空闲 块 (而 不 是 已 分 配 的 块 ) 还 使 用 一 个 双重 
链表 进行 链接 。 这 个 链表 的 指针 就 存放 在 这 些 块 中 ,比如 说 存放 在 紧 挨 着 某 一 端 边 界 标 
记 的 位 置 上 。 因 此 , 不 需要 额外 的 空间 来 存放 这 个 空闲 块 列表 , 尽管 它 的 存在 为 块 的 大 
小 设置 了 一 个 下 界 。 即 使 数据 对 象 只 有 一 个 字 节 ,存储 块 也 必须 提供 存放 两 个 边界 标记 
和 两 个 指针 的 空间 。 空 闲 列表 中 的 存储 块 的 顺序 没有 确定 。 例 如 ,这 个 列表 可 以 按 块 的 
大 小 排序 , 因此 可 以 支持 best-fit 放置 策略 。 
DEAD 67-0 给 出 堆 区 的 一 个 部 分 , 其 中 包含 三 个 相 邻 的 存储 块 A、B 和 Cs。 B 块 的 大 小 为 
100, 它 刚 刚 被 回收 并 回 到 了 空闲 列表 中 。 因 为 我 们 知道 B 的 开始 位 置 ( 左 端 ) ,也 就 知道 了 紧 舍 
TE B 的 左边 的 存储 块 的 末端 , 在 这 个 例子 中 就 是 A。A 有 端的 free/used 位 当前 为 0, 因此 A 也 是 
空闲 的 。 于 是 我 们 可 以 将 AM B 接合 成 一 个 300 字 节 的 存储 块 。 
有 可 能 出 现 这 样 的 情况 , 即 紧 靠 在 B 的 右 端 的 存储 块 C 也 是 空闲 的 。 在 这 种 情况 下 , 我 们 可 
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以 把 A、B 和 C 全 部 合并 起 来 。 请 注意 , 如 果 我 们 总 是 尽 可 能 地 把 存储 块 接 合 起 来 , 那么 就 不 会 
有 两 个 连续 的 空闲 块 。 因 此 我 们 总 是 只 需要 查看 与 正 被 回收 的 块 相 邻 的 两 个 块 。 在 当前 例子 中 ， 
我 们 按照 下 面 的 步骤 找到 C 的 开始 位 置 。 我 们 从 已 知 的 B 的 左 端 开始 , 在 B 的 左边 界 标记 中 知 
道 B 块 的 总 字 节 数 为 100 字 节 。 根 据 这 个 信息 , 我 们 可 以 找到 B 的 右 端 和 紧 靠 在 B 右边 的 存储 
块 的 起 始 位 置 。 在 该 点 上 , 我 们 检查 C 的 free/used 位 , 发 现 其 值 为 1, 表明 C 正在 被 使 用 , 因此 
C 不 可 以 被 接合 。 





存储 块 4 存储 块 BB 存储 块 C 








图 7-17， 堆 的 片段 和 一 个 双重 链接 的 空闲 列表 


因为 我 们 必须 接合 A 和 B, 所 以 需要 从 空闲 列表 中 删除 它们 中 的 一 个 。 空 闲 列表 的 双重 链接 
结构 使 得 我 们 可 以 找到 A 和 了 中 的 前 驱 和 后 继 结 点 。 请 注意 , 不 应 该 假定 在 物理 上 相 邻 的 A 和 
B 在 空闲 列表 中 也 相 邻 。 知 道 了 A 和 了 B 在 空闲 列表 中 的 前 驱 和 后 继 的 存储 块 ， 就 可 以 操作 列表 
中 的 指针 并 将 A AI B 替换 为 一 个 接合 后 的 存储 块 。 o 

如 果 自 动 垃圾 回收 过 程 将 所 有 已 分 配 的 存储 块 移动 到 一 段 连续 的 存储 中 , 它 同 时 还 可 以 消 
除 所 有 的 碎片 。 在 7.6.4 节 中 将 更 详细 地 讨论 垃圾 回收 机 制 和 存储 管理 之 间 的 相互 影响 ， 
7.4.5 人 工 回收 请 求 

我 们 在 本 节 的 最 后 讨论 人 工 存储 管理 。 此 时 , 程序 员 必 须 像 在 C 和 C ++ 语言 中 那样 显 式 地 
安排 数据 的 回收 。 在 理想 情况 下 , 任何 不 会 再 被 访问 的 存储 都 应 该 删除 。 反 过 来 ,任何 可 能 还 会 
被 引用 的 空间 都 不 能 删除 。 遗 憾 的 是 , 这 两 个 性 质 都 很 难保 证 。 除 了 考虑 人 工 回收 的 困难 之 处 
以 外 , 我 们 还 将 描述 一 些 被 程序 员 用 于 处 理 这 些 难 点 的 技术 。 

人 工 回 收费 来 的 问题 

人 工 存储 管理 很 容易 出 错 。 常 见 的 错误 有 两 种 形式 : 一 直 未 能 删除 不 能 被 引用 的 数据 , 这 称 
为 内 存 泄漏 (memory-leak) 错 误 ; 引用 已 经 被 删除 的 数据 , 这 称 为 悬空 指针 引用 (dangling-pointer- 
dereference ) 错误 。 

程序 员 不 能 保证 一 个 程序 是 否 永 远 不 会 在 将 来 引用 某 块 存储 , 因此 第 一 个 常见 的 错误 是 没 
有 删除 那些 不 会 被 再 次 引用 的 数据 。 请 注意 , 尽管 内 存 泄漏 可 能 由 于 占用 的 存储 增多 而 降低 程 
序 运行 的 速度 , 但 是 只 要 机 器 没有 用 完全 部 存储 , 它们 就 不 会 影响 程序 的 正确 性 。 很 多 程序 可 以 
容忍 内 存 泄漏 ， 当 泄漏 比较 缓慢 时 尤其 如 此 。 然 而 , 对 于 长 期 运行 的 程序 , 特别 是 像 操 作 系 统 和 
服务 器 代码 这 样 不 间断 运行 的 程序 , 保证 它们 没有 内 存 泄漏 是 非常 关键 的 。 

自动 垃圾 回收 通过 回收 所 有 的 垃圾 而 消除 了 内 存 泄 漏 问题 。 即 使 使 用 自动 垃圾 回收 机 制 ， 
程序 可 能 仍然 耗费 了 过 多 的 内 存 。 有 时 尽管 在 某 处 还 存在 着 对 某 个 对 象 的 引用 , 但 程序 员 可 能 
已 经 知道 该 对 象 不 会 再 被 引用 。 在 那 种 情况 下 , 程序 员 可 以 主动 地 删除 指向 那些 不 会 再 被 引用 
的 对 象 的 引用 , 使 得 这 些 对 象 可 以 被 自动 回收 。 











一 个 工具 实例 :Purify 
Rational 的 Purify 是 帮助 程序 员 寻 找 程序 中 的 内 存 访 问 错误 和 内 存 泄 漏 的 最 常用 的 商业 
工具 之 一 。Purify 对 二 进 制 代码 进行 插 装 , 加 入 在 程序 运行 时 检查 程序 错误 的 附加 指令 。 它 
维护 了 一 个 存储 的 映像 图 , 指明 所 有 空闲 的 和 已 用 的 空间 的 分 布 。 每 个 已 分 配 空间 的 对 象 都 
被 一 段 额 外 空间 包围 ;对 未 分 配 空间 的 访问 ,或 对 数据 对 象 之 间 的 间隙 空间 的 访问 都 被 标记 
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为 错误 。 通 过 这 种 方法 可 以 找到 一 些 悬 空 指针 引用 , 但 是 当 该 内 存 已 经 被 重新 分 配 且 该 位 置 
上 已 经 存在 一 个 有 效 对 象 时 , 这 种 方法 就 无 能 为 力 了 。 这 种 方法 还 可 以 找到 一 些 越界 的 数组 
访问 , 前 提 是 它们 恰巧 落 在 这 些 对 象 之 后 , 由 Purify 插入 的 空间 中 。 

Purify 也 可 以 在 程序 运行 结束 时 发 现 内 存 泄漏 。 它 搜索 所 有 的 已 分 配 的 对 象 中 的 内 容 ， 
找 出 所 有 可 能 的 指针 值 。 任 何 没有 指针 指向 的 对 象 都 是 一 块 泄漏 的 存储 块 。Purify 可 以 报告 
泄漏 内 存 的 大 小 和 泄漏 对 象 的 位 置 。 我 们 可 以 将 Purify 和 一 个 “保守 的 垃圾 回收 器 " 相 比较 ， 
后 者 将 在 7. 8.3 节 中 讨论 。 











过 度 热 衷 于 删除 对 象 可 能 引起 比 内 存 泄漏 更 严重 的 问题 。 第 二 个 常见 的 错误 是 删除 了 某 个 
存储 空间 ,然后 又 试图 去 引用 这 个 已 回收 空间 中 的 数据 。 指 向 已 回收 空间 的 指针 称 为 悬空 指针 
(dangling pointer) 。 一 旦 这 个 已 释放 的 空间 被 重新 分 配给 男 一 个 变量 , 通过 该 悬空 指针 进行 的 任 
何 读 、 写 或 回收 操作 都 可 能 产生 看 起 来 不 可 捉摸 的 结果 。 我 们 把 诸如 读 、 写 、 回收 等 沿 着 一 个 指 
针 试图 使 用 该 指针 所 指 对 象 的 所 有 操作 称 为 对 这 个 指针 的 “ 解 引用 ”( dereferencing) 。 

注意 , 通过 一 个 悬空 指针 读 取 数 据 可 能 会 返回 不 确定 的 值 。 通 过 一 个 其 空 指针 进行 写 操作 
则 可 能 不 确定 地 改变 新 变量 的 值 。 回 收 一 个 悬空 指针 的 存储 空间 意味 着 这 个 新 变量 的 存储 空间 
可 能 被 分 配给 另 一 个 变量 。 新 旧 变 量 上 的 动作 可 能 会 相互 冲突 。 

和 内 存 泄 漏 不 二 样 , 在 释放 的 空间 被 重新 分 配 之 后 再 对 相应 的 悬空 指针 进行 解 引用 总 是 会 
带 来 难以 调试 的 程序 错误 。 因 而 ， 当 程序 员 不 能 确定 一 个 变量 是 否 还 会 被 引用 时 ， 他 们 更 倾向 于 
不 回收 该 变量 。 

另 一 个 相关 的 编程 错误 形式 是 访问 非法 地 址 。 这 种 错误 的 常见 例子 包括 对 空 指针 的 解 引用 
和 访问 一 个 数组 界限 之 外 的 元 素 。 探 测 出 这 种 错误 要 好 过 任 由 程序 产生 错误 结果 。 实 际 上 , 很 
多 安全 危害 就 是 利用 了 这 种 类 型 的 程序 错误 。 其 中 , 某 个 程序 输入 会 导致 意 想不到 的 数据 访问 ， 
使 得 一 个 黑客 取得 这 个 程序 和 机 器 的 控制 权 。 解 决 办 法 之 一 是 让 编译 器 在 每 次 访问 中 插 人 检查 
代码 , 以 保证 该 次 访问 在 数组 界限 之 内 。 一 些 编译 器 的 优化 器 可 以 发 现 并 删除 那些 不 必要 的 检 
查 代码 , 因为 这 些 优化 器 能 够 推导 出 相应 的 访问 必然 在 区 间 之 内 。 

编程 规范 和 工具 

现在 我 们 给 出 几 个 最 流行 的 编程 规范 和 工具 , 开发 它们 的 目的 是 帮助 程序 员 来 应 对 的 存储 
管理 的 复杂 性 : 

o 当 一 个 对 象 的 生命 周期 能 够 被 静态 推导 出 来 时 , 对 象 所 有 者 (object ownership ) 的 概念 是 
很 有 用 的 。 它 的 基本 思想 是 在 任何 时 候 都 给 每 个 对 象 关联 上 一 个 所 有 者 (owner) 。 这 个 
所 有 者 是 指向 该 对 象 的 一 个 指针 , 通常 属于 某 个 函数 调用 。 所 有 者 (也 就 是 这 个 函数 ) 负 
责 删除 这 个 对 象 或 者 把 这 个 对 象 传递 给 另 一 个 所 有 者 。 可 能 会 有 其 他 的 指针 也 指向 同一 
个 对 象 , 但 是 这 些 指针 不 代表 拥有 关系 。 这 些 指针 可 在 任何 时 刻 被 覆盖 , 但 是 绝对 不 应 
该 通过 它们 进行 删除 操作 。 这 个 规范 可 以 消除 内 存 泄漏 ， 同 时 也 可 以 避免 将 同一 对 象 删 
除 两 次 。 然 而 , 它 对 解决 悬空 指针 引用 问题 没有 帮助 , 因为 有 可 能 沿 着 一 个 不 代表 拥有 
关系 的 指针 访问 一 个 已 经 被 删除 的 对 象 。 

当 一 个 对 象 的 生命 周期 需要 动态 确定 时 ， 引 用 计数 (reference counting ) 会 有 所 帮助 。 它 的 
基本 思想 是 给 每 个 动态 分 配 的 对 象 附 上 一 个 计数 。 在 指向 这 个 对 象 的 引用 被 创建 时 , 我 
们 将 此 对 象 的 引用 计数 加 一 ; 当 一 个 引用 被 删除 时 ,我们 将 此 引用 计数 减 一 。 当 计数 变 
成 0 时 , 这 个 对 象 就 不 会 再 被 引用 , 因此 可 以 被 删除 。 然 而 ,这 个 技术 不 能 发 现 无 用 的 循 
环 数据 结构 , 其 中 的 一 组 对 象 不 能 再 被 访问 , 但 是 因为 它们 之 间 互 相 引 用 , 导致 它们 的 引 
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用 计数 不 为 0。 在 例子 7. 11 中 可 以 看 到 这 个 问题 的 一 个 示例 。 引 用 计数 技术 确实 可 以 根 
除 所 有 的 悬空 指针 引用 ， 因 为 不 存在 指向 已 删除 对 象 的 引用 。 因 为 引用 计数 在 存储 一 个 
指针 的 每 次 运算 上 增加 了 额外 开销 , 因此 引用 计数 的 运行 时 刻 代价 很 大 。 
对 于 其 生命 周期 局 限于 计算 过 程 中 的 某 个 特定 阶段 的 一 组 对 象 , 可 以 使 用 基于 区 域 的 分 
配 (region-based allocation) 方 法 。 当 被 创建 的 对 象 只 在 一 个 计算 过 程 的 某 个 步骤 中 使 用 
时 , 我 们 可 以 把 这 些 对 象 分 配 在 同一 个 区 域 中 。 一 旦 这 个 计算 步骤 完成 , 我 们 就 删除 整 
个 区 域 。 基 于 区 域 的 分 配方 法 有 一 定 的 局 限 性 。 然 而 当 可 以 使 用 它 时 , 它 又 非常 高 效 。 
因为 该 技术 以 成 批 的 方式 一 次 性 删除 区 域 中 的 所 有 对 象 , 而 不 是 每 次 回收 一 个 对 象 。 
7.4.6 7.4 节 的 练习 

练习 7. 4. 1: 假设 堆 区 从 0 地 址 开始 编 址 , 由 几 个 存储 块 组 成 。 按 照 地 址 顺序 , 这 些 存 储 块 
的 大 小 分 别 是 80, 30, 60, 50, 70, 20, 40 个 字 节 。 当 我 们 在 一 个 存储 块 中 放 入 一 个 对 象 时 , 如 果 
该 块 中 的 剩余 空间 仍然 足以 形成 一 个 较 小 的 块 , 我 们 就 将 此 对 象 放置 在 块 的 高 端 ( 这 样 可 以 比较 
容易 地 把 较 小 的 块 保存 在 空闲 空间 的 链表 中 ) 。 然 而 , 我 们 不 能 使 用 小 于 8 个 字 节 的 存储 块 ， 因 
此 如 果 一 个 对 象 和 被 选中 的 存储 块 差不多 大 , 我 们 就 把 整个 块 分 配给 它 , 并 将 这 个 对 象 放置 在 这 
个 块 的 低 端 。 如 果 我 们 按 顺 序 为 大 小 分 别 为 32、64、48、16 的 对 象 申请 空间 , 在 满足 了 这 些 请 求 
之 后 的 空闲 空间 列表 是 什么 样子 的 ? 假设 选择 存储 块 的 方法 是 : 

1) First-fit 

2) Best-fit 


7.5 垃圾 回收 概述 


不 能 被 引用 的 数据 通常 称 为 垃圾 ( garbage)。 很 多 高 级 程序 设计 语言 提供 了 用 以 回收 不 可 达 
数据 的 自动 垃圾 回收 机 制 , 从 而 解除 了 程序 员 进 行 手工 存储 管理 的 负担 。 垃 圾 回收 最 早出 现在 
1958 年 的 Lisp 语言 的 初次 实现 中 。 其 他 提供 垃圾 回收 机 制 的 主要 语言 包括 Java, Perl, ML, Mod- 
ula-3 , Prolog 和 Smalltalk, 

在 本 节 中 , 我 们 将 介绍 多 个 和 垃圾 回收 相关 的 概念 。 对 象 " 可 达 ”这 个 概念 是 很 直观 的 , 但 
是 我 们 仍 需要 精确 地 定义 ,准确 的 规则 将 在 7. 5. 2 节 中 讨论 。 我 们 将 在 7. 5. 3 节 中 讨论 一 种 简单 
但 是 有 缺陷 的 自动 垃圾 回收 方法 : 引用 计数 。 它 基于 如 下 的 思想 : 一 旦 一 个 程序 失去 了 指向 一 个 
对 象 的 所 有 引用 , 它 就 不 能 并 且 也 不 会 再 引用 该 对 象 的 存储 空间 。 

7.6 节 将 讨论 基于 跟踪 的 回收 器 。 它 包含 多 个 算法 , 用 以 找 出 所 有 仍然 有 用 的 对 象 , 然后 将 
堆 区 中 所 有 的 其 他 存储 块 变 成 空闲 空间 。 

7. 5.1 ,垃圾 回收 器 的 设计 目标 

垃圾 回收 是 重新 收回 那些 存放 了 不 能 再 被 程序 访问 的 对 象 的 存储 块 。 我 们 假定 这 些 对 象 的 
类 型 可 以 由 垃圾 回收 器 在 运行 时 刻 确定 。 基 于 这 个 类 型 信息 , 我 们 可 以 知道 该 对 象 有 多 大 ,以 及 
该 对 象 的 哪些 分 量 包含 指向 其 他 对 象 的 引用 (指针 ) 。 我 们 还 假定 对 对 象 的 引用 总 是 指向 该 对 象 
的 起 始 位 置 , 而 不 会 指向 该 对 象 中 间 的 位 置 。 因 此 , 对 同一 个 对 象 的 所 有 引用 具有 相同 的 值 , 可 
以 被 很 容易 地 识别 。 

我 们 把 一 个 用 户 程序 称 为 增 变 者 (mutator) ， 它 会 修改 堆 区 中 的 对 象 集合 。 增 变 者 从 存储 管 
理 器 处 获取 空间 , 创建 对 象 , 它 还 可 以 引入 和 消除 对 已 有 对 象 的 引用 。 当 增 变 者 程序 不 能 “到 
达 ” 某 些 对 象 时 , 这 些 对 象 就 变 成 了 垃圾 。 在 7.5.2 节 中 将 给 出 “到 达 ” 的 准确 定义 。 垃 圾 回收 器 
找到 这 些 不 可 达 对 象 , 并 将 这 些 对 象 交 给 跟踪 空闲 空间 的 存储 管理 器 , 收回 它们 所 占 的 空间 。 
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一 个 基本 要 求 : 类 型 安全 

不 是 所 有 的 语言 都 适合 进行 自动 垃圾 回收 。 为 了 使 垃圾 回收 器 能 够 工作 , 它 必须 知道 任何 
给 定 的 数据 元 素 或 一 个 数据 元 素 的 分 量 是 否 为 (或 可 否 被 用 作 ) 一 个 指向 某 块 已 分 配 存储 空间 的 
指针 。 在 一 种 语言 中 , 如 果 任 何 数据 分 量 的 类 型 都 是 可 确定 的 ， 那么 这 种 语言 就 称 为 类 型 安全 
(typesafe) 的 。 对 于 某 些 类 型 安全 的 语言 ,比如 ML， 我 们 可 以 在 编译 时 刻 确 定数 据 的 类 型 。 另 外 
一 些 类 型 安全 语言 ， 比 如 Java, 其 类 型 不 能 在 编译 时 刻 确定 , 但 是 可 以 在 运行 时 刻 确定 。 后 者 称 
为 动态 类 型 (dynamically typed As 如 果 一 个 语言 既 不 是 静态 类 型 安全 的 ， 也 不 是 动态 类 型 安 
全 的 , 它 就 被 称 为 不 安全 的 (unsafe)。 

类 型 不 安全 的 语言 不 适合 使 用 自动 垃圾 回收 机 制 。 遗 憾 的 是 ， 有 些 最 重要 语言 却 是 类 型 不 
安全 的 , 比如 C 和 C++。 在 不 安全 语言 中 , 存储 地 址 可 以 进行 任意 操作 : 可 以 将 任意 的 算术 运 
算 应 用 于 指针 , 创建 出 一 个 新 的 指针 , 并 且 任 何 整数 都 可 以 被 强制 转化 为 指针 。 因 此 ， 从 理论 上 
来 说 , 一 个 程序 可 以 在 任何 时 候 引 用 内 存 中 的 任何 位 置 。 这 样 , 没有 哪个 内 存 位 置 可 以 被 认为 是 
不 可 访问 的 , 也 就 无 法 安全 地 收回 任何 存储 空间 。 

在 实践 中 , 大 部 分 C 和 C ++ 程序 并 没有 随意 地 生成 指针 。 因 此 人 们 开发 了 一 个 在 理论 上 不 
正确 , 但 是 实践 经 验 表明 很 有 效 的 垃圾 回收 器 。 我 们 将 在 7. 8. 3 节 中 讨论 用 于 C 和 C++ 语言 
保守 的 垃圾 回收 技术 。 

性 能 度量 

尽管 在 几 十 年 前 就 发 明了 垃圾 回收 机 制 , 并 且 它 能 够 完全 防止 内 存 泄漏 , 但 是 垃圾 回收 的 代 
价 是 如 此 高 昂 , 所 以 至 今 没有 被 很 多 主流 的 程序 设计 语言 使 用 。 在 多 年 的 研究 中 , 很 多 不 同 的 回 
收 方法 被 提出 来 , 但 是 还 没有 一 种 无 可 争议 的 最 好 的 垃圾 回收 算法 。 在 讨论 这 些 方法 之 前 , 我们 
首先 列举 一 些 在 设计 垃圾 回收 器 时 必须 考虑 的 性 能 度量 标准 。 

o 总 体 运行 时 间 。 垃 圾 回收 的 速度 可 能 会 很 慢 。 使 它 不 会 显著 增加 一 个 应 用 程序 的 总 运行 
时 间 是 很 重要 的 。 因 为 垃圾 回收 器 必须 要 访问 很 多 数据 , 它 的 性 能 很 大 程度 上 决定 于 它 
能 否 充 分 利用 存储 子 系统 。 
空间 使 用 。 重 要 之 处 在 于 垃圾 回收 机 制 避免 了 内 存 碎 片 ， 并 最 大 限度 地 利用 了 可 用 内 存 。 
停顿 时 间 。 简 单 的 垃圾 回收 器 有 一 个 众所周知 的 问题 , 即 垃圾 回收 过 程 会 在 没有 任何 预 
警 的 情况 下 突然 启动 , 导致 程序 ( 即 增 变 者 ) 突然 长 时 间 停顿 。 因 此 , 除了 最 小 化 总 体 运 
行 时 间 之 外 ， 人 们 还 希望 将 最 长 停顿 时 间 最 小 化 。 作 为 一 个 重要 的 特例 , 实时 应 用 要 求 
某 些 计算 在 一 个 时 间 界 限 内 完成 。 我 们 要 么 在 执行 实时 任务 时 压制 住 垃 圾 回收 过 程 ,要 
么 限定 最 长 停顿 时 间 。 因 此 , 垃圾 回收 机 制 很 少 在 实时 应 用 中 使 用 。 
程序 局 部 性 。 我 们 不 能 只 通过 一 个 垃圾 回收 器 的 运行 时 间 来 评价 它 的 速度 。 垃 圾 回收 需 
控制 了 数据 的 放置 , 因此 影响 了 增 变 者 程序 的 数据 局 部 性 。 它 可 以 通过 释放 空间 并 复 用 
该 空间 来 改善 增 变 者 程序 的 时 间 局 部 性 ; 它 也 可 以 将 那些 一 起 使 用 的 数据 重新 放置 在 同 
一 个 高 速 缓 存 线 或 内 存 页 上 , 从 而 改善 程序 的 空间 局 部 性 。 

这 些 设计 目标 中 的 某 些 目标 可 能 互相 冲突 , 设计 者 必须 在 认真 考虑 程序 的 典型 行为 之 后 作 
出 权衡 。 和 不 同 特性 的 对 象 可 能 适 会 使 用 不 同 的 处 理 方 式 , 这 就 要 求 垃圾 回收 器 使 用 不 同 的 技术 
来 处 理 不 同类 型 的 对 象 。 

例如 , 已 分 配 的 对 象 数量 中 小 对 象 的 数量 很 天 比例 ,那么 对 小 对 象 的 分 配 不 能 产生 大 的 开 
销 。 另 一 方面 ,考虑 一 下 对 可 达 对 象 进行 重 定位 的 垃圾 回收 器 。 在 处 理 大 对 象 时 重新 定位 是 非 
常 昂贵 的 , 但 在 处 理 小 对 象 时 代价 就 比较 小 。 

考虑 另 一 个 例子 。 一 般 来 说 , 在 基于 跟踪 的 回收 器 中 , 我 们 等 待 垃圾 回收 的 时 间 越 长 , 可 回 
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收 对 象 的 比例 就 越 大 。 原 因 在 于 很 多 对 象 常常 “ 英 年 早 逝 ”, 因此 如 果 我 们 等 一 段 时 间 , 很 多 新 
分 配 的 对 象 就 会 变 成 不 可 达 的 。 这 样 的 回收 器 平均 花 在 每 个 被 回收 对 象 上 的 开销 就 会 变 小 。 为 
一 方面 , 降低 回收 频率 会 增加 程序 的 内 存 使 用 要 求 ， 降低 数据 局 部 性 , 并 增加 停顿 时 间 。 
相 比 之 下 , 一 个 使 用 引用 计数 的 回收 器 给 增 变 者 的 每 次 运算 引入 一 个 常量 开销 , 从 而 明显 地 
减 慢 程序 的 整体 运行 速度 。 但 是 另 一 方面 , 引用 计数 技术 不 会 产生 长 时 间 的 停顿 , 并 且 能 够 有 效 
地 利用 内 存 , 因为 它 可 以 在 垃圾 产生 时 立刻 发 现 它们 (除了 7.5.3 节 中 将 讨论 的 特定 的 循环 结 
构 )。 
语言 的 设计 同样 会 影响 内 存 使 用 的 特性 。 有 些 语言 提倡 的 程序 设计 风格 会 产生 很 多 垃圾 。 
比如 ， 函数 式 (或 者 几乎 函数 式 ) 的 程序 设计 语言 为 了 避免 改变 已 存在 的 对 象 , 会 创建 出 更 多 的 
对 象 。 在 Java H, 除了 整 型 和 引用 这 样 的 基本 类 型 , 所 有 的 对 象 都 被 分 配 在 堆 区 而 不 是 栈 区 。 即 
使 这 些 对 象 的 生命 周期 被 限制 在 一 次 函数 调用 的 生命 周期 内 , 它们 仍然 被 分 到 堆 区 中 。 这 种 设 
计 使 得 程序 员 不 需要 关注 变量 的 生命 周期 ， 但 是 其 代价 是 产生 更 多 的 垃圾 。 已 经 有 一 些 编译 器 
优化 技术 可 以 分 析 变 量 的 生命 周期 , 并 尽 可 能 地 将 它们 分 配 到 栈 区 。 
7.5.2 可 达 性 
我 们 把 所 有 不 需要 对 任何 指针 解 引 用 就 可 以 被 程序 直接 访问 的 数据 称 为 根 集 (root set) 。 例 
如 , 在 Java 中 , 一 个 程序 的 根 集 由 所 有 的 静态 字段 成 员 和 栈 中 的 所 有 变量 组 成 。 显 然 , 程序 可 以 
在 任何 时 候 访 问 根 集中 的 任何 成 员 。 递 归 地 , 对 于 任意 一 个 对 象 ， 如 果 指 向 它 的 一 个 引用 被 保存 
在 任何 可 达 对 象 的 字段 成 员 或 数组 元 素 中 , 那么 这 个 对 象 本 身 也 是 可 达 的 。 
当 程 序 被 编译 器 优化 之 后 , 可 达 性 问题 会 变 得 更 加 复杂 。 首 先 , 编译 器 可 能 会 把 引用 变量 放 
在 寄存 器 中 。 这 些 引 用 也 必须 被 看 做 是 根 集 的 一 部 分 。 其 次 , 尽管 在 一 个 类 型 安全 语言 中 , 程序 
员 不 能 直接 操作 内 存 地 址 , 但 是 编译 器 常常 会 为 了 提高 代码 速度 而 这 么 做 。 因 此 , 编译 得 到 的 代 
码 中 的 寄存 器 可 能 会 指向 一 个 对 象 或 数组 的 中 间 位 置 , 或 者 程序 可 能 把 一 个 偏 移 量 加 到 这 些 寄 
存 器 中 的 值 上 , 计算 得 到 一 个 合法 地 址 。 为 了 使 得 垃圾 回收 右 能 够 找到 正确 的 根 集 , 优化 编译 句 
可 以 做 如 下 的 处 理 : 
o 编译 器 可 以 限制 垃圾 回收 机 制 只 能 在 程序 中 的 某 些 代 码 点 上 被 激活 。 在 这 些 点 上 没有 
“隐藏 ”的 引用 。 
e 编译 器 可 以 写 出 一 些 信息 供 垃圾 回收 器 恢复 所 有 的 引用 。 比 如 , 指出 哪些 寄存 器 中 包含 
了 引用 , 或 者 如 何 根据 给 定 的 某 个 对 象 的 内 部 地 址 来 计算 该 对 象 的 基地 址 。 
o 编译 器 可 以 确保 当 垃 圾 回收 器 被 激活 时 每 个 可 达 对 象 都 有 一 个 引用 指向 它 的 基地 址 。 
可 达 对 象 的 集合 随 着 程序 的 执行 而 变化 。 当 新 对 象 被 创建 时 该 集合 会 增长 ， 当 某 些 对 象 变 
得 不 可 达 时 该 集合 就 缩小 。 重 要 的 是 记 住 一 旦 某 个 对 象 变 得 不 可 达 , 它 就 不 可 能 再 次 变 得 可 达 。 
下 面 是 一 个 增 变 者 程序 改变 可 达 对 象 集合 的 四 种 基本 操作 : 
e 对 象 分 配 。 这 些 操作 由 存储 管理 器 完成 。 它 返回 一 个 指向 新 创建 的 存储 区 域 的 引用 。 这 
个 操作 向 可 达 对 象 集中 添加 成 员 。 
© 参数 传递 和 返回 值 。 对 象 引 用 从 实在 输入 参数 传递 到 相应 的 形式 参数 , 也 可 以 从 返回 结 
果 传 回 给 调用 者 。 这 些 引 用 指向 的 对 象 仍然 是 可 达 的 。 
e 引用 赋值 。 对 于 引用 二 和 Balu =o 的 赋值 语句 有 两 个 效果 。 首 先 ,过 现在 是 所 指 对 
象 的 一 个 引用 。 只 要 w 是 可 达 的 , 那么 它 指向 的 对 象 当 然 也 是 可 达 的 。 其 次 , u 中 原来 的 
引用 丢失 了 。 如 果 这 个 引用 是 指向 某 一 可 达 对 象 的 最 后 一 个 引用 , 那么 那个 对 象 就 变 成 
不 可 达 的 。 当 某 个 对 象 变 得 不 可 达 时 ,所 有 只 能 通过 这 个 对 象 中 的 引用 到 达 的 对 象 都 会 
变 成 不 可 达 的 。 
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。 过程 返回 。 当 一 个 过 程 退出 时 , 保存 其 局 部 变量 的 活动 记录 将 被 弹出 栈 。 如 果 这 个 活动 记 
录 中 保存 了 某 个 对 象 的 唯一 引用 , 那个 对 象 就 变 得 不 可 达 。 同 样 ， 如 果 这 个 刚刚 变 得 不 可 达 
的 对 象 保存 了 指向 其 他 对 象 的 唯一 引用 , 那么 那些 对 象 也 将 变 得 不 可 达 ， 以 此 类 推 。 
总 而 言 之 , 新 的 对 象 通过 对 象 分 配 被 引入。 参数 传递 和 赋值 可 以 传递 可 达 性 ; 赋值 和 过 程 结 
束 可 能 结束 对 象 的 可 达 性 。 当 一 个 对 象 变 得 不 可 达 时 ， 可 能 会 导致 更 多 的 对 象 变 得 不 可 达 。 





栈 对 象 的 残存 问题 
当 一 个 过 程 被 调用 时 , 一 个 局 部 变量 的 对 象 被 分 配 在 栈 中 。 可 能 会 有 一 些 指向 ” 的 指 
针 被 放置 在 非 局 部 变量 中 。 这 些 指针 将 在 这 个 过 程 返回 之 后 继续 存在 , 但 是 存放 ” 的 空间 消 
失 了 ,从 而 产生 了 一 个 悬空 指针 的 情况 。 我 们 是 否 应 该 象 C 所 作 的 那样 将 象 " 这 样 的 局 部 变 
量 分 配 在 栈 中 呢 ? 答案 是 很 多 语言 的 语义 要 求 局 部 变量 在 它们 的 过 程 返回 后 不 再 存在 。 保留 
一 个 指向 这 样 的 变量 的 引用 是 一 个 编程 错误 , 不 会 要 求 编译 器 去 改正 程序 中 的 这 个 错误 。 











有 两 种 寻找 不 可 达 对 象 的 基本 方法 。 我 们 可 以 捕获 可 达 对 象 变 得 不 可 达 的 转变 时 刻 ,也 可 
以 周期 性 地 定位 出 所 有 可 达 对 象 , 然后 推出 所 有 其 他 对 象 都 是 不 可 达 的 。7. 4.5 节 中 介绍 的 引用 
计数 技术 是 一 种 著名 的 近似 实现 第 一 种 方法 的 技术 。 我 们 在 增 变 者 执行 可 能 改变 可 达 对 和 象 集合 
的 动作 时 , 维护 了 指向 各 个 对 象 的 引用 的 计数 。 当 计数 器 变 成 0 时 , 相应 的 对 象 变 得 不 可 达 。 我 
们 将 在 7.5.3 节 中 更 详细 地 讨论 这 个 方法 。 

第 二 种 方法 传递 地 跟踪 所 有 的 引用 , 从 而 计算 可 达 性 。 一 个 基于 跟踪 的 垃圾 回收 器 首先 为 
根 集中 的 所 有 对 象 加 上 “可 达 的 ”标号 , 然后 重复 地 检查 可 达 对 和 象 中 的 所 有 引用 , 找到 更 多 的 可 
RMR, 并 为 它们 加 上 同样 的 标号 。 这 个 方法 必须 首先 跟踪 所 有 的 引用 , 然后 才能 决定 哪些 对 象 
是 不 可 达 的 。 但 是 一 旦 计算 得 到 可 达 集 合 , 它 就 可 以 立刻 找到 很 多 不 可 达 对 象 , 并 同时 确定 大 量 
的 空闲 存储 空间 。 因 为 所 有 的 引用 都 必须 在 同一 时 刻 进行 分 析 , 所 以 我 们 还 可 以 选择 将 可 过 对 
象 重新 定位 , 从 而 减少 碎片 。 有 很 多 种 不 同 的 基于 跟踪 的 算法 , 我 们 将 在 7.6 节 和 7.7.1 节 中 讨 
论 这 些 可 选 算法 。 

7.5.3 引用 计数 垃圾 回收 器 

现在 ,我 们 考虑 一 个 简单 但 有 缺陷 的 基于 引用 计数 的 垃圾 回收 器 。 当 一 个 对 象 从 可 达 转 变 
为 不 可 达 的 时 候 , 该 回收 器 就 可 以 将 该 对 象 确认 为 垃圾 ; 当 一 个 对 象 的 引用 计数 为 0 时 ,该 对 象 
就 会 被 删除 。 使 用 引用 计数 的 垃圾 回收 器 时 ,每 个 对 象 必须 有 一 个 用 于 存放 引用 计数 的 字段 
引用 计数 可 以 按照 下 面 的 方法 进行 维护 : 

1) 对 象 分 配 。 新 对 象 的 引用 计数 被 设置 为 1。 

2) 参数 传递 。 被 传递 给 一 个 过 程 的 每 个 对 象 的 引用 计数 加 一 。 

3) 引用 赋值 。 如 果 w 和 vw 都 是 引用 , 对 于 语句 w=wv,v 指 向 的 对 象 的 引用 计数 加 1,w 本 来 指 
向 的 原 对 象 的 引用 计数 减 1。 

4) 过 程 返回 。 当 一 个 过 程 退出 时 , 该 过 程 活 动 记 录 的 局 部 变量 中 所 指向 的 对 象 的 引用 数 必 
须 减 一 。 如 果 多 个 局 部 变量 存放 了 指向 同一 对 和 象 的 引用 , 那么 对 每 个 这 样 的 引用 , 该 对 象 的 引用 
计数 都 要 减 1。 

5) 可 达 性 的 传递 丢失 。 当 一 个 对 象 的 引用 计数 变 成 0 时 , 我 们 必须 将 该 对 象 中 的 各 个 引用 
所 指向 的 每 个 对 和 象 的 引用 计数 减 1。 

引用 计数 有 两 个 主要 的 缺点 : 它 不 能 回收 不 可 达 的 循环 数据 结构 , 并 且 它 的 开销 较 大 。 循 环 
数据 结构 的 出 现 都 是 有 理由 的 : 数据 结构 常常 会 指 回 到 它们 的 父 结 点 , 也 可 能 相互 指向 对 方 ， 从 
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而 形成 交叉 引用 。 
图 7-18 给 出 了 三 个 对 象 以 及 
它们 之 间 的 引用 , 但 是 没有 来 自 其 他 部 。 
分 的 引用 。 如 果 这 些 对 象 都 不 是 根 集 的 “ 
RA, 那么 它们 都 是 垃圾 ,但 是 它们 的 
引用 计数 都 大 于 0。 如 果 我 们 在 垃圾 回 “、 
收 中 使 用 引用 计数 技术 , 这 个 情况 就 等 mes 
同 于 一 次 内 存 泄 漏 ， 因为 这 种 垃圾 以 及 
任何 类 似 的 结构 永远 不 会 被 回收 。 Oo 图 7-18 PAS SR ERO 

引用 计数 的 开销 比较 大 ,因为 每 一 次 引用 赋值 ,以 及 在 每 个 过 程 的 入 口 和 出 口 处 ; 都 会 增加 
一 个 额外 运算 。 这 个 开销 和 程序 中 的 计算 量 成 正比 关系 ,而 不 仅仅 和 系统 中 的 对 象 数目 相关 。 
需要 特别 考虑 的 是 对 一 个 程序 的 根 集中 的 引用 的 更 新 。 局 部 栈 访问 会 引起 引用 计数 的 更 新 ,为 
了 消除 因 这 种 更 新 而 引起 的 时 间 开销 ， 人 们 提出 了 延期 引用 计数 的 概念 。 也 就 是 说 , 引用 计数 不 
包括 来 自 程序 根 集 的 引用 。 除 非 扫 描 整 个 根 集 仍 没有 找到 指向 某 一 对 象 的 引用 ,否则 这 个 对 象 
不 会 被 当 作 垃 圾 。 

另 一 方面 , 引用 计数 的 优势 在 于 垃圾 回收 是 以 增 量 方式 完成 的 。 尽 管 总 的 开销 可 能 很 大 , 但 
这 些 运算 分 布 在 增 变 者 的 整个 计算 过 程 中 。 尽 管 删除 一 个 引用 可 能 致使 大 量 对 象 变 得 不 可 达 ， 
我 们 可 以 很 容易 地 延期 执行 递归 地 修改 引用 计数 的 运算 ,并 在 不 同 的 时 间 点 上 逐步 完成 修改 。 
因此 ， 当 应 用 必须 满足 某 个 时 间 期 限时 ,或 者 对 于 不 能 接受 长 时 间 突 然 停顿 的 交互 式 系统 而 言 ， 
引用 计数 是 一 种 特别 有 吸引 力 的 算法 。 这 个 方法 的 另 一 种 优势 是 垃圾 被 及 时 回收 ， 从 而 保持 了 
较 低 的 空间 使 用 量 。 
7.5.4 7.5 节 的 练习 

练习 7.5.1: 当下 列 事件 发 生 时 , 图 7-19 中 的 对 象 的 引用 计数 会 发 生 哪 些 改变 ? 

1) 从 A 指向 B 的 指针 被 删除 。 

2) 从 X 指向 A 的 指针 被 删除 。 

3) 结 点 C 被 删除 。 

练习 7. 5. 2: 当 图 7-20 中 的 从 A 到 D 的 指针 被 删除 时 ,引用 计数 会 发 生 什么 样 的 改变 ? 


没有 来 自 
…、、 外 部 的 指针 


1 
1 














(4) @) © 
© E) ©) 


图 7-19 一 个 对 象 网 络 图 7-20 另 一 个 对 象 网 络 
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7.6 基于 跟踪 的 回收 的 介绍 


基于 跟踪 的 回收 器 并 不 在 垃圾 产生 的 时 候 就 进行 回收 , 而 是 会 周期 性 地 运行 ， 寻找 不 可 达 对 
象 并 收回 它们 的 空间 。 通常 的 做 法 是 在 空闲 空间 被 耗 尽 或 者 空闲 空间 数量 低 于 某 个 阐 值 时 启动 
垃圾 回收 器 。 

在 本 节 中 , 我们 首先 介绍 最 简单 的 “标记 - 清扫 式 " 垃 圾 回收 算法 。 然 后 我 们 将 通过 存储 块 
可 能 具有 的 四 种 状态 来 描述 多 个 基于 跟踪 的 算法 。 这 一 节 中 还 包含 了 一 些 对 基本 算法 的 改进 ， 
包括 那些 将 对 象 重 定位 加 入 到 垃圾 回收 功能 中 的 算法 。 
7.6.1 基本 的 标记 - 清扫 式 回 收 器 

标记 -清扫 式 (mark-and-sweep) 垃 圾 回收 算法 是 一 种 直接 的 全 面 停顿 的 算法 。 它 们 找 出 所 有 
不 可 达 的 对 象 ， 并 将 它们 放 人 空闲 空间 列表 。 算 法 7. 12 在 一 开始 的 跟踪 步骤 中 访问 并 “标记 -所 
有 的 可 达 对 象 ， 然后 “清扫 ”整个 堆 区 并 释放 不 可 达 对 象 。 在 介绍 了 基于 跟踪 的 算法 的 一 个 一 般 
性 框架 之 后 , 我 们 将 考虑 算法 7. 14, 它 是 算法 7. 12 的 一 个 优化 。 算 法 7.14 使 用 一 个 附加 的 列表 
来 保存 所 有 已 分 配对 象 , 使 得 它 对 每 个 可 达 对 象 只 访问 一 次 。 
标记 -清扫 式 垃圾 回收 。 

输入 : 一 个 由 对 象 组 成 的 根 集 ; 一 个 堆 和 一 个 被 称 为 Free 的 包含 了 堆 中 所 有 未 分 配 存储 块 的 
室 闲 室 间 列表 (free list), #7.4.4 节 中 一 样 , 所 有 空间 块 都 用 边界 标记 进行 标识 , 指明 它们 的 空 
闲 / 已 用 状态 和 大 小 。 

输出 : 在 删除 了 所 有 垃圾 之 后 的 经 过 修改 的 Free 列表 。 

方法 : 在 图 7.21 中 显示 的 算法 使 用 了 几 个 简单 的 数据 结构 。 列 表 Free 保存 了 已 知 的 空闲 对 
象 。 一 个 名 为 Unscanned 的 列表 保存 了 我 们 已 经 确定 可 达 的 对 象 , 但 是 我 们 还 没有 考虑 这 些 对 象 
的 后 继 对 象 的 可 达 性 。 也 就 是 说 , 我 们 还 没有 扫描 这 些 对 象 来 确定 通过 它们 能 够 到 达 哪 些 对 象 。 
列表 Unscanned 最 初 为 空 。 另 外 , 每 个 对 象 包括 一 个 比特 , 用 来 指明 该 对 象 是 否 可 达 ( BN reached 
位 )。 在 算法 开始 之 前 , 所 有 已 分 配对 象 的 reached 位 都 被 设 定 为 0。 
/* 标记 阶段 */ 
1) /* 把 被 根 集 引 用 的 每 个 对 象 的 reached 位 设置 为 1， 并 把 它 加 入 

到 Unscanned 列表 中 ;*/ 

2) while (Unscanned # 9) { 


3) 从 Unscanned 列表 中 删除 某 个 对 象 5 
4) for (在 o 中 引用 的 每 个 对 象 o ) { 























5) if (o! 尚未 被 访问 到 ， 即 它 的 reached 位 为 0) { 
6) Ho! 的 reached 位 设置 为 1; 
7) } 将 o' 放 到 Unscanmed 中 ; 


} 


} 
/* 清扫 阶段 */ 
8) Free = 9; 
9) for ( 堆 区 中 的 每 个 内 存 块 和) { 
10) if (o 未 被 访问 到 ， 即 它 的 reached 位 为 0) 将 o 加 入 到 Freet; 
else 将 0 的 reached 位 设置 为 0; 


图 7-21 一 个 标记 -清扫 式 垃圾 回收 器 


在 图 7-21 的 第 (1) 行 , 我们 初始 化 Unscanned 列表 , 在 其 中 放 入 所 有 被 根 集 引 用 的 对 象 。 同 
时 这 些 对 象 的 reached 位 被 设置 为 1。 第 (2) 行 到 第 (7) 行 是 一 个 循环 , 在 此 循环 中 我 们 逐个 检查 
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每 个 已 经 被 放 和 人 Unscanned 列表 中 的 对 象 os 

从 第 (4) 行 到 第 (7) 行 的 for 循环 实现 了 对 对 象 o 的 扫描 。 我 们 检查 每 个 在 。 中 被 引用 的 对 象 
o'o 如 果 o' 已 经 被 访问 过 (其 reached 位 为 1) ; 那么 就 不 需要 对 o' 做 任何 处 理 ; 它 要 么 已 经 在 之 前 
被 扫描 过 , 要 人 么 已 经 在 Unscanned 列表 中 等 待 扫 描 。 然 而 ， 如果 o' 还 没有 被 访问 到 ,那么 我 们 需 
要 在 第 (6) 行 将 它 的 reached 位 设置 为 1, 并 在 第 (7) 行 中 将 o' 加 入 到 Unscanned 列表 中 。 图 7-22 
说 明了 这 个 过 程 。 它 显示 了 一 个 带 有 四 个 对 象 的 Unscanned 列表 。 列 表 中 的 第 一 个 对 象 对 应 于 上 
述 讨论 中 的 对 象 o。 它 正在 被 扫描 。 虚 线 对 应 于 可 能 从 io 到 达 的 三 种 类 型 的 对 象 : 

1) 之 前 扫描 过 的 对 象 , 它 不 需要 被 再 次 扫描 。 

2) 当前 在 Unscanned 列表 中 的 对 象 。 

3) 一 个 可 达 的 数据 项 , 但 是 之 前 它 被 认为 是 未 被 访问 的 。 


Unscanned 





空 闪 的 和 未 被 访问 过 的 对 象 
d 位 =0 


Teache 


待 扫描 的 及 之 前 已 经 扫描 过 的 对 象 
reached fiz =1 


图 7-22 一 个 标记 -清扫 式 垃圾 回收 器 的 标记 阶段 中 对 象 之 间 的 关系 
第 (8) 行 到 第 (11) 行 是 清扫 阶段 , 它 收回 所 有 那些 在 标记 阶段 结束 之 后 仍然 未 被 访问 到 的 对 
象 的 空间 。 请 注意 , 这 些 对 象 将 包括 所 有 原本 就 在 Free 列表 中 的 对 象 。 因为 无 法 直接 枚 举 不 可 
达 对 象 的 集合 ,这 个 算法 将 清扫 整个 堆 区 。 第 (10) 行 将 空闲 且 不 可 达 的 对 象 乏 个 放 入 Free 列表 。 
第 (11) 行 处 理 可 达 对 象 。 我 们 将 它们 的 reached 位 设 为 0， 以 便 在 这 个 垃圾 回收 算法 下 一 次 运行 


时 ,其 前 置 条 件 得 到 满足 。 v4 
7.6.2 基本 抽象 yi 

所 有 基于 跟踪 的 算法 者 计算 可 达 对 象 全 “CC_ 空 的 7 
A, 然后 取 这 个 集合 的 补 集 。 因 此 ,， 内存 是 T 


按照 下 列 方式 循环 使 用 的 ， 


1) 程序 (或 者 说 增 变 者 ) 运行 并 发 出 分 
配 请 求 。 

2) 垃圾 回收 器 通过 跟踪 揭示 可 达 性 。 

3) 垃圾 回收 器 收回 不 可 达 对 象 的 存储 通过 跟 辽 发现 可 过 性 
空间 。 

图 7-23 按照 存储 块 的 四 种 状态 ( 空 闪 (Cm 的 = 


的 、 未 被 访问 的 、 待 扫描 的 和 已 扫描 的 ) 说 sea ane 
明 这 个 循环 。 一 个 存储 块 的 状态 可 以 存储 在 D> ye Sete 
数据 结构 隐 含 地 表示 。 

方法 上 有 所 不 同 ， 但 是 它们 都 可 以 通过 下 列 状态 进行 描述 : 






从 根 集 
访问 到 
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1) 空闲 的 。 存 储 块 处 于 空闲 状态 表示 它 可 以 被 分 配 。 因 此, 一 个 空闲 块 内 不 会 存放 任何 可 
MR 

2) 未 被 访问 的 。 除 非 通过 跟踪 证 明 存储 块 可 达 ， 否则 它 被 默认 为 是 不 可 达 的 。 在 垃圾 回收 
过 程 中 的 任何 时 刻 ; 如 果 还 没有 确定 一 个 块 的 可 达 性 , 该 块 就 处 于 未 被 访问 的 状态 。 如 图 7-23a 
所 示 ， 当 一 个 存储 块 被 存储 管理 器 分 配 出 去 时 , 它 的 状态 就 被 设置 为 未 被 访问 的 。 一 轮 垃圾 回收 
之 后 , 可 达 对 象 的 状态 仍然 会 被 重 置 为 未 被 访问 状态 , 以 准备 下 一 轮 处 理 , 参见 图 中 从 已 扫描 状 
态 到 未 被 访问 状态 的 转换 。 这 个 转换 用 虚线 显示 , 以 强调 它 是 为 下 一 轮 处 理 做 准备 。 

3) 待 扫描 的 。 已 知 可 达 的 存储 块 要 么 处 于 待 担 描 状 态 , 要 么 处 于 已 扫描 状态 。 如 果 已 知 一 
个 存储 块 是 可 达 的 , 但 是 该 块 中 的 指针 还 没 被 扫描 , 那么 该 块 就 处 于 待 扫描 状态 。 当 我 们 发 现 某 
个 块 可 达 时 ,就 会 发 生 一 个 从 未 被 访问 状态 到 待 扫描 状态 的 转换 ,如 图 7223b 所 示 。 

4) 已 扫描 的 。 每 个 待 扫描 对 象 最 终 都 将 被 扫描 并 转换 到 已 扫描 状态 。 在 扫描 一 个 对 象 时 ， 
我 们 检查 其 内 部 的 各 个 指针 , 并 且 沿 着 这 些 指针 找到 它们 引用 的 对 象 。 如 果 引 用 指向 一 个 未 被 
访问 的 对 象 , 那么 该 对 象 将 被 设 为 待 扫描 状态 。 当 对 一 个 对 象 的 扫描 结束 时 ,这 个 对 象 被 放 人 已 
扫描 状态 , 见 7-23b 中 下 面 的 转换 。 一 个 已 扫描 的 对 象 只 能 包含 指向 其 他 已 扫描 或 待 扫描 对 象 的 
引用 , 决 不 会 包含 指向 未 被 访问 对 象 的 引用 。 

当 不 再 有 对 象 处 于 待 扫 挡 状态 时 ,可 达 性 的 计算 就 完成 了 。 到 最 后 仍然 处 于 未 被 访问 状态 
的 对 象 确实 是 不 可 达 的 。 垃 圾 回收 器 收回 它们 占用 的 空间 , 并 将 这 些 存储 块 置 于 空闲 的 状态 , 如 
图 7.23e 中 实 线 转换 所 示 。 为 了 准备 下 一 轮 垃圾 回收 , 处 于 已 扫描 状态 中 的 对 象 将 回 到 未 被 访问 
RS, 见 图 7-23c 中 的 虚线 转换 。 再 次 提醒 大 家 , 这 些 对 象 现在 确实 是 可 达 的 。 将 它们 设 定 为 未 
被 访问 状态 是 正确 的 , 因为 当下 一 轮 垃圾 回收 开始 时 , 我 们 将 要 求 所 有 对 象 都 从 这 个 状态 出 发 。 
在 那个 时 候 ,当前 可 达 的 某 些 对 象 可 能 实际 上 已 经 被 变 成 了 不 可 达 的 。 

DAE REFERT. 12 中 的 数据 结构 与 上 面 介绍 的 四 种 状态 有 什么 关系 。 使 用 reached 
位 ,以 及 是 否 在 列表 Free 和 Unscanned P, 我 们 可 以 区 分 全 部 四 种 状态 。 图 7-24 中 的 表格 归纳 了 
用 算法 7. 12 中 的 数据 结构 来 刻画 四 种 状态 的 方式 。 口 








在 列表 yee 中 在 Unscanned 列 表 中 Reached 位 
0 





空闲 

未 被 访问 的 
待 扫描 否 
已 扫描 A 





ÑN 
Oy fim ON DY 


0 
1 
1 





图 7-24 算法 7. 12 中 状态 的 表示 方式 


7.6.3 标记 -清扫 式 算法 的 优化 

基本 的 标记 - 清扫 式 算法 的 最 后 一 步 的 代价 很 大 , 因为 没有 一 个 容易 的 方法 可 以 不 用 检查 
整个 堆 区 就 找到 所 有 不 可 达 对 象 。 由 Baker 提出 的 一 个 优化 算法 用 一 个 列表 记录 了 所 有 已 分 配 
的 对 象 。 我 们 必须 将 不 可 达 对 象 的 存储 返回 给 空闲 空间 。 为 了 找 出 不 可 达 对 象 的 集合 , 我 们 可 
以 求 已 分 配对 象 和 可 达 对 象 之 间 的 差 集 。 
Baker 的 标记 - 清扫 式 回收 器 。 

输入 : 一 个 由 对 象 组 成 的 根 集 , 一 个 堆 区 , 一 个 空闲 列表 Free, 一 个 名 为 Unreached 的 已 分 配 
对 象 的 列表 。 

输出 : 经 过 修改 的 Free 列表 和 Unreached 列表 。Unreached 列表 保存 了 被 分 配 的 对 象 。 

方法 : 这 个 算法 如 图 7-25 所 示 。 算 法 中 用 于 垃圾 回收 的 数据 结构 是 名 字 分 别 为 Free, 
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Unreached ,Unscanned , Scanned 的 四 个 列表 。 这 些 列表 分 别 保存 了 处 于 空闲 、 未 被 访问 、 待 扫描 和 
已 扫描 状态 上 的 所 有 对 象 。 像 7.4. 4 节 中 讨论 的 那样 , 这 些 列表 可 以 通过 骨 信 式 的 双重 链表 来 实 
现 。 对 象 中 的 reached 位 没有 被 使 用 , 但 是 我 们 假定 每 个 对 象 中 都 包含 了 一 些 三 进 制 位 , 指明 该 
对 和 象 处 于 上 述 四 个 状态 的 哪 一 个 。 最 初 ，Free 就 是 由 存储 管理 器 维护 的 空闲 列表 , 所 有 已 分 配 的 
对 象 都 在 Unreached 列表 中 (这 个 表 同 时 也 由 存储 管理 器 在 为 对 象 分 配 存 储 块 时 维护 ) 。 


Scanned = ); 
Unscanned = 在 根 集中 引用 的 对 象 的 集合 ; 并 将 这 些 对 象 从 Unreached 中 删除 ; 
while (Unscanned # 0) { 

HARM Unscanned 移动 到 Scanned; 

for (在 co 中 引用 的 每 个 对 象 0 ) { 


if (o' {E Unreached} ) 
H o' M Unreached 移动 到 Unscanmed 中 ; 
} 
} 
Free = Free U Unreached; 
Unreached = Scanned; 





图 7-25 Baker 的 标记 - 清扫 式 算法 


第 (1)、(2) 行 将 Scanned 列表 初始 化 为 空 列 表 , 并 将 Unscanned 列表 初始 化 为 仅 包 含 那些 可 
以 从 根 集 访问 的 对 象 。 值 得 注意 的 是 , 这 些 对 象 本 来 都 在 列表 Unreached 中 , 现在 它们 必须 从 该 
列表 中 删除 。 第 (3) 行 到 第 (7) 行 是 一 个 使 用 这 些 列表 的 基本 标记 - 清扫 式 算 法 的 简单 实现 。 也 
就 是 说 , 第 (5) 行 到 第 (7) 行 的 for 循环 检查 了 一 个 待 扫描 对 象 。 中 的 所 有 引用 ,如果 这 些 引 用 中 
的 某 一 个 o' 还 没有 被 访问 过 , 则 第 (7) 行 将 o' 改 变 为 待 扫描 状态 。 

然后 , 第 (8) 行 处 理 所 有 仍然 在 Unreached 列表 中 的 对 象 , 将 它们 移 到 Free 列表 中 , 从 而 回收 
它们 的 存储 块 。 然 后 , 第 (9) 行 处 理 所 有 处 于 已 扫描 状态 的 对 象 , 即 所 有 的 可 达 对 和 象 , 并 将 
Unreached 列表 重新 初始 化 , 使 之 恰好 包含 这 些 对 象 。 我 们 假设 ， 当 存储 管理 器 创建 新 对 象 时 , 它 
们 同样 会 被 移出 Free 列表 , 加 入 到 Unreached 列表 中 。 Ed 

在 本 节 介 绍 的 两 个 算法 中 , 我 们 都 假设 返回 给 空闲 列表 的 存储 块 仍然 保持 被 回收 前 的 样子 。 
然而 , 如 7.4.4 节 中 讨论 的 , 将 相 邻 的 空闲 块 合并 成 较 大 的 块 常常 会 带 来 好 处 。 如 果 我 们 想 这 样 
做 , 那么 在 图 7-21 的 第 (10) 行 或 图 7-25 的 第 (8) 行 上 , 每 次 我 们 将 一 个 存储 块 放 人 空闲 列表 时 ， 
我 们 检查 该 块 的 左 端 和 右 端 ， 如 果 有 一 端 为 空闲 就 进行 合并 。 
7.6.4 标记 并 压缩 的 垃圾 回收 器 

进行 重新 定位 (relocating) 的 垃圾 回收 器 会 在 堆 区 内 移动 可 达 对 象 以 消除 存储 碎片 。 通 常 ， 
可 达 对 象 占 用 的 空间 要 大 大 小 于 空闲 空间 。 因 此 , 在 标记 出 所 有 的 “窗口 ”之 后 并 不 一 定 要 逐个 
释放 这 些 空间 , 另 一 个 有 吸引 力 的 做 法 是 将 所 有 可 达 对 象 重新 定位 到 堆 区 的 一 端 , 使 得 堆 区 的 所 
有 空闲 空间 成 为 一 个 块 。 毕 竟 垃 圾 回收 器 已 经 分 析 了 可 达 对 象 中 的 每 个 引用 , 因此 更 新 这 些 引 
用 使 之 指向 新 的 存储 位 置 并 不 需要 增加 很 多 工作 量 。 我 们 需要 改变 的 全 部 引用 包括 可 达 对 象 中 
的 引用 和 根 集中 的 引用 。 

将 所 有 可 达 对 象 放 在 一 段 连续 的 位 置 上 可 以 减少 内 存 空间 的 碎片 , 使 得 它 更 容易 存储 较 大 的 对 
象 。 同 时 , 通过 使 数据 占用 更 少 的 缓存 线 和 内 存 页 , 重新 定位 可 以 提高 程序 的 时 间 局 部 性 和 空间 局 
部 性 , 因为 几乎 同时 创建 的 对 象 将 被 分 配 在 相 邻 的 存储 块 中 。 如 果 这 些 相 邻 的 块 中 的 对 象 一 起 使 
FA, 那么 就 可 以 从 数据 预 取 中 得 到 好 处 。 不 仅 如 此 , 用 以 维护 空闲 空间 的 数据 结构 也 可 以 得 到 简 
化 。 我 们 不 再 需要 一 个 空闲 空间 列表 ， 需要 的 只 是 一 个 指向 唯一 空闲 块 的 起 始 位 置 的 指针 free, 
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存在 多 种 进行 重新 定位 的 回收 器 ， 其 不 同 之 处 在 于 它们 是 在 本 地 进行 重新 定位 ; 还 是 在 重新 
定位 之 前 预 留 了 空间 : 
© 本 节 描 述 的 标记 并 压缩 回收 器 (mark-and-compact collector) 在 本 地 压缩 对 象 。 在 本 地 重新 
定位 可 以 降低 存储 需求 。 ; 
。7. 6.5 节 中 给 出 了 更 高 效 、 更 流行 的 拷贝 回收 器 ( copying collector), 它 把 对 象 从 内 存 的 一 
个 区 域 移 到 另 一 个 区 域 。 保 留 额外 的 空间 用 于 重新 定位 可 以 使 得 一 发 现 可 达 对 象 就 立刻 
移动 它 。 
算法 7. 15 中 的 标记 并 压缩 垃圾 回收 器 有 3 个 阶段 : 
1) 首先 是 标记 阶段 , 它 和 前 面 描述 的 标记 - 清扫 式 算 法 的 标记 阶段 类 似 。 
2) 在 第 二 阶段 , 算法 扫描 堆 区 中 的 已 分 配 内 存 段 ， 并 为 每 个 可 达 对 象 计算 新 的 地 址 。 新 地 
址 从 堆 的 最 低 端 开始 分 配 , 因此 在 可 达 对 象 之 间 没 有 空闲 存储 窗口 。 每 个 对 象 的 新 地 址 记录 在 
一 个 名 为 NewLocation 的 结构 中 。 
3) 最 后 , 算法 将 对 象 拷贝 到 它们 的 新 地 址 , 更 新 对 象 中 的 所 有 引用 , 使 之 指向 相应 的 新 地 
址 。 新 的 地 址 可 以 在 NewLocation 中 找到 。 
一 个 标记 并 压缩 的 垃圾 回收 器 。 
输入 : 一 个 由 对 象 组 成 的 根 集 , 一 个 堆 , 以 及 一 个 标记 空闲 空间 的 起 始 位 置 的 指针 free。 
输出 : 指针 free 的 新 值 。 














使 用 下 列 的 数据 结构 : en ae rh ty 
while nscanne 

1) 一 个 Unscanned 列表 , 同 算法 7.12 3) 从 Unscanned 中 移 除 对 象 0; 

中 的 Unscanned 列表 5. han T 2 AOA, y 
> if (o! 访问 的 

2) 所 有 对 象 的 reached 位 也 和 算法 7. 12 , 将 o' 标 记 为 已 被 访问 的 ; 
中 相同 。 为 了 使 我 们 的 描述 简单 ， 当 我 们 要 |? it EAR li 
说 一 个 对 象 的 reached 位 为 1 或 0 时 , 我 们 分 ) } 
别称 它们 为 “已 被 访问 的 ”或 “未 被 访问 的 ”。 Je 计算 新 的 位 置 */ 

Se 8) free = 堆 区 的 开始 位 置 ; 

3) 指针 fre, 标记 了 堆 区 中 未 分 配 空间 |10) if (o 是 已 被 访问 的 { 

的 开始 位 置 bi po = hig 
o ee = free + sizeof(o); 

4) NewLocation 表 。 这 个 结构 可 以 是 任 we 
意 一 个 实现 了 如 下 两 个 操作 的 散 列表 、 搜索 /* 重新 设置 引用 目标 并 移动 已 被 访问 的 对 象 */ 
树 或 其 他 数据 结构 : ic for n oe { 

if (o 是 访问 的 

D 将 NewLocation (0) HAM o 的 新 | 19) ae (o 中 的 每 个 引用 o.r ) 
地 址 Y o.r = NewLocation(o.r); 

P 将 2 Bll NewLocati ; 

@ 给 定 对 和 象 。, 得 到 NewLocation (0) ) } a 
的 值 。 18) for ( 根 集中 的 每 个 引用 7 ) 

我 们 不 会 关心 到 底 使 用 了 什么 样 的 数据 19) r = NewLocation(r); 
an fe ` > E oll TINS 
结构 , 虽然 你 可 以 假设 NewLocation 是 一 了 图 7.26 ”一 个 标记 并 压缩 回收 器 


散 列表 , 因此 “set” 和 “get” 操 作 所 需要 的 平 
均 时 间 为 某 个 常量 , 这 个 时 间 和 堆 区 内 的 对 象 数 量 无 关 。 
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第 (1) 行 到 第 (7) 行 的 第 一 (或 标记 ) 阶段 在 本 质 上 和 算法 7. 12 的 第 一 阶段 相同 。 第 二 阶段 
是 从 第 (8) 行 到 第 (12) 行 。 该 阶段 从 左边 (或 者 说 从 低地 址 端 ) 开 始 访问 堆 中 的 已 分 配 部 分 的 每 
一 个 存储 块 。 结 果 , 被 分 配给 存储 块 的 新 地 址 与 它们 的 老 地 址 按照 同样 的 顺序 增长 。 这 个 顺序 
很 重要 , 它 可 以 保证 我 们 在 重新 定位 对 象 时 总 是 将 对 象 向 左 移 ; 那么 在 移动 时 , 原来 占据 目标 空 
间 的 对 象 已 经 被 我 们 移 走 了 。 

第 (8) 行 首先 将 free 指针 设 定 为 指向 堆 区 的 低 端 。 在 这 个 阶段 , 我 们 使 用 free 来 指示 第 一 个 
可 用 的 新 地 址 。 我 们 只 会 为 标记 为 已 被 访问 的 对 象 o。 创建 新 的 地 址 。 在 第 (10) 行 中 , 对 象 o 被 赋 
予 下 一 个 可 用 地 址 ; 在 第 (11) 行 ;我 们 根据 对 象 o 需要 的 存储 数量 增加 .free 指针 ,因此 .free 仍然 
指向 空闲 空间 的 开始 位 置 。 

从 第 (13) 行 到 第 (17) 行 是 最 后 阶段 , 此 时 我 们 再 次 按照 第 二 阶段 中 的 自 左 向 右 的 顺序 访问 
可 达 对 象 。 第 (15) 、(16 ) 行将 一 个 已 被 访问 到 的 对 象 。 的 所 有 内 部 指针 蔡 换 为 它们 的 新 地 址 ， 
NewLocation 表 用 来 确定 这 个 新 的 地 址 。 然 后 , 第 (17 ) 行 将 内 部 引用 已 被 更 新 的 对 象 。 移动 到 新 的 
位 置 。 最 后 , 第 (18) 和 (19) 行 重新 确定 根 集 元 素 中 的 指针 指向 的 目标 , 这 些 元 素 本 身 不 是 堆 区 
WR, 它们 可 能 是 静态 分 配对 象 或 栈 分 配对 象 。 图 7-27 说 明了 如 何 将 可 达 对 象 (图 中 无 阴影 的 对 
象 ) 移 动 到 堆 区 的 底部 , 同时 内 部 指针 被 修改 , 指向 已 被 访问 对 象 的 新 位 置 。 加 














空闲 
图 7-27 将 已 被 访问 对 象 移动 到 堆 的 前 部 ,同时 保持 内 部 指针 的 指向 关系 


7. 6.5， 找 贝 回收 器 

拷贝 回收 器 预先 保留 了 可 以 将 对 象 移 人 的 空间 , 因而 解除 了 跟踪 和 发 现 空闲 空间 之 间 的 依 
赖 关 系 。 整 个 存储 空间 被 划分 为 两 个 半空 间 ( semispace) A 和 B。 增 变 者 在 半空 间 之 一 ( 比如 A) 
内 分 配 内 存 , 直到 它 被 填 满 》 此 时 增 变 者 停止 ,垃圾 回收 器 将 可 达 对 象 拷贝 到 另 一 个 半空 间 , 比 
如 说 B。 当 垃 圾 回收 完成 时 ,两 个 半空 间 的 角色 进行 对 换 。 增 变 者 可 以 继续 运行 , 并 在 半空 间 B 
中 分 配对 象 ; 下 一 轮 垃圾 回收 将 把 可 达 对 象 移动 到 A。 下 面 的 算法 是 由 C. J. Cheney 提出 的 。 
Cheney 的 拷贝 回收 器 。 

输入 : 一 个 由 对 象 组 成 的 根 集 , 一 个 包含 了 From 半空 间 和 To 半空 间 的 堆 区 , 其 中 From 半空 
间 包含 了 已 分 配对 象 ，7o 半空 间 全 部 是 空闲 的 。 

输出 : 最 后 ，72 半空 间 保存 已 分 配 的 对 象 。free 指针 指明 了 To 半空 间 中 剩余 空闲 空间 的 开 
始 位 置 。From 半空 间 此 时 全 部 空闲 。 

方法 :| 图 7-28 显示 了 这 个 算法 。 Cheney 算法 在 From 半空 间 中 找 出 可 达 对 象 , 并 且 访 问 到 它 
们 时 立刻 把 它们 拷贝 到 To 半空 间 。 这 种 放置 方法 将 相关 对 和 象 放 在 一 起 ; 从 而 提高 空间 局 部 性 。 

在 探讨 算法 本 身 ( 即 图 7-28 中 的 函数 CopyingCollector) 之 前 ,首先 考虑 第 (11) 行 到 第 (16) 行 
的 辅助 函数 LookupNewLocation。 该 函数 的 输入 是 一 个 对 象 。, 如果。 在 To 空间 中 还 没有 对 应 的 位 
置 , 则 为 其 分 配 一 个 To 空间 中 的 新 地 址 。 所 有 新 地 址 都 被 记录 在 一 个 结构 NewLocation 中 , 特殊 
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值 Null 用 来 表示 还 没有 为 o。 AMARO, 和 算法 7. 15 一 样 ，NewLocation 结构 的 具体 形式 可 以 变 
化 ; 但 是 现在 假设 它 是 一 个 哈 希 表 就 行 了 。 

如 果 我 们 在 第 (12) 行 发 现 o 没有 存储 位 置 , 那么 在 第 (13) 行 上 它 将 被 赋予 T 半空 间 中 空闲 
空间 的 开始 位 置 。 第 (14) 行 使 free 指针 增加 6 所 占 的 空间 数量 。 在 第 (15) 行 , 我 们 将 o 从 From 
SEENA To 空间 。 因 此 , 对象 从 一 个 半空 间 到 另 一 个 半空 间 的 移动 实际 上 是 一 个 函数 的 副 作 
用 。 这 个 副作用 发 生 在 我 们 第 一 次 为 这 个 对 象 寻找 新 地 址 的 时 候 。 不 管 之 前 有 没有 设 定 对 象 
的 位 置 , 第 (16) 行 返回 5 在 To 空间 中 的 位 置 。 





1) CopyingCollector () { 


2) for (From 空间 中 的 所 有 对 象 0) NewLocation(o) =NULL; 
3) unscanned = free = To 空间 的 开始 地 址 ; 
4) for ( 根 集中 的 每 个 引用 7 ) 
5) I rikf LookupNewLocations(r); 
6) while (unscanned # free) { 
7) o = fEunscanned 所 指 位 置 上 的 对 象 ; 
8) for (o 中 的 每 个 引用 o-r ) 
9) o.r = LookupNewLocation(o.r); 
10) unscanned = unscanned + sizeof(o); 


} 
} 


入 如 果 一 个 对 象 已 经 被 移动 过 了 ， 查 找 这 个 对 象 的 新 位 置 */ 
k 否则 将 对 象 设置 为 待 扫描 状态 */ 
11) LookupNewLocation(o) { 


12) if (NewLocation(o) = NULL) { 

13) NewLocation(o) = free; 

14) free = free + sizeof(o); 

15) 将 对 象 o 拷贝 到 NewLocation(o); 
16) return NewLocation(o); 








图 7228 ， 一 个 拷贝 垃圾 回收 器 


现在 我 们 可 以 考虑 这 个 算法 本 身 了 。 第 (2) 行 确保 From 空间 中 的 所 有 对 象 都 还 没有 新 地 址 。 
在 第 (3) 行 中 ; 我 们 初始 化 两 个 指针 unscanned Ail free, 使 它们 都 指向 To 半空 间 的 开始 位 置 。 指 针 
free 将 总 是 指向 To 半空 间 中 空闲 空间 的 起 始 位 置 。 当 我 们 往 To 空间 加 入 对 象 时 , 那些 地 址 低 于 
unscanned 的 对 象 将 处 于 已 扫描 状态 ,而 那些 位 于 wnscanned Fil free 之 间 的 对 象 则 处 于 待 扫 描 状 
Ao 因此， free 总 是 在 unscanned 的 前 面 。 当 后 者 追 上 前 者 时 就 表示 不 存在 更 多 的 待 要 描 对 象 了 ， 
我 们 就 完成 了 垃圾 回收 工作 。 请 注意 , 我 们 是 在 To 空间 中 完成 垃圾 回收 工作 的 , 尽管 在 第 (8 ) 行 
中 检查 的 对 象 中 的 所 有 引用 都 是 指向 From 空间 的 。 

第 (4) 行 和 第 (5) 行 处 理 可 以 从 根 集 访 问 到 的 对 象 。 请 注意 , 因为 函数 副作用 , 在 第 (5) 行 中 
对 LookupNewLocation 的 某 些 调用 会 在 To 中 为 这 些 对 象 分 配 存储 块 , 同时 增加 free 指针 的 值 。 因 
此 , 除非 没有 被 根 集 引用 的 对 象 (在 这 种 情况 下 ,整个 堆 区 都 是 垃圾 ) ， 当 程序 第 一 次 运行 到 这 里 
时 将 进入 第 (6) 行 到 第 (10) 行 的 循环 。 然 后 , 这 个 循环 扫描 所 有 已 经 被 加 入 到 To 空间 中 并 处 于 
FARREN R. 第 (7) 行 处 理 下 一 个 待 扫描 的 对 象 。。 在 第 (8)、(9) 行 , 对于。 中 的 每 个 引 
FA, MEHE From 半空 间 中 的 原 值 被 翻译 为 在 To 半空 间 中 的 值 。 请 注意 ， 因 为 函数 副作用 ,如果 





O 在 一 个 典型 的 数据 结构 中 (如 散 列表 ) ,如果 。 没有 被 赋予 一 个 位 置 , 那么 在 这 个 结构 中 就 没有 相关 信息 。 


运行 时 刻 环境 3H 








o 内 的 某 个 引用 所 指向 的 对 象 之 前 还 没有 被 访问 过 , 那么 第 (9) 行 中 对 LookupNewLocation 的 调用 
将 在 To 室 间 中 为 这 个 对 象 分 配 空 间 并 将 它 移 到 该 空间 中 。 最 后 ， 第 (10 ) 行 增加 指针 unscanned 
的 值 , 使 之 指向 下 一 个 对 象 , 即 To 空间 中 之 后 的 对 象 。 Oo 
7.6.6 开销 的 比较 

Cheney 算法 的 优势 在 于 它 不 会 涉及 任何 不 可 达 对 象 。 另 一 方面 ,拷贝 垃圾 回收 器 必须 移动 
所 有 可 达 对 象 的 内 容 。 对 于 大 型 对 象 , 或 者 那些 经 历 了 多 轮 垃圾 收集 过 程 的 生命 周期 长 的 对 象 
而 言 ; 这 个 过 程 的 开销 特别 高 。 我 们 对 本 节 给 出 的 四 种 算法 的 运行 时 间 进 行 总 结 。 下 面 的 每 个 
估算 都 忽略 了 处 理 根 集 的 开销 。 s 

。 基本 的 标记 - 清扫 式 算 法 (算法 7. 12) : 与 堆 区 中 存储 块 的 数目 成 正比 。 

© Baker 的 标记 - 清扫 式 算 法 (算法 7. 14) : 与 可 达 对 象 的 数目 成 正比 。 

。 基本 的 标记 并 压缩 算法 (算法 7. 15 ) : 与 堆 区 中 存储 块 的 数目 和 可 达 对 象 的 总 大 小 成 

JE ko 

e Cheney 的 拷贝 回收 器 (算法 7.16); 与 可 达 对 象 的 总 大 小 成 正比 。 
7.6.7 7.6 节 的 练习 

练习 7. 6.1: 当下 列 事件 发 生 时 ,给 出 标记 — 清扫 式 垃圾 回收 器 的 处 理 步 又 。 

1) 图 7-19 中 指针 4 一 B 被 删除 。 

2) 图 7-19 中 指针 AC 被 删除 。 

3) 图 7-20 中 指针 4 一 被 删除 。 

4) 图 7220 中 对 象 B 被 删除 。 

练习 7. 6.2: Baker 的 标记 = 清扫 式 算 法 在 四 个 列表 Free、Unreached、Unscanned 和 Scanned 之 
间 移 动 对 象 。 对 于 练习 7. 6. 1 中 的 每 个 对 象 网 络 中 的 每 个 对 象 , 指出 从 垃圾 回收 过 程 刚 开始 到 该 
过 程 刚 结束 的 时 间 段 内 ， 该 对 象 所 经 历 的 列表 的 序列 。 

练习 7. 6. 3: 假设 我 们 在 练习 7. 6. 1 中 的 各 个 网 络 上 执行 了 一 个 标记 并 压缩 垃圾 回收 过 程 。 
同时 假设 

1) 每 个 对 象 的 大 小 是 100 个 字 节 。 

2) 在 开始 时 刻 , 堆 区 中 的 9 个 对 象 按照 字母 顺序 从 堆 区 的 第 0 个 字 节 开始 排列 。 

在 垃圾 回收 过 程 结束 之 后 , 各 个 对 象 的 地 址 是 什么 ? 

练习 7. 6.4: 假设 我 们 在 练习 7.6.1 中 的 各 个 网 络 上 执行 了 Cheney 的 拷贝 垃圾 回收 算法 。 
同时 假设 

1) 每 个 对 象 的 大 小 为 100 字 节 。 

2) 待 扫描 的 列表 按照 队列 的 方式 进行 管理 , 并 且 当 一 个 对 象 具有 多 个 指针 时 , 被 访问 到 的 
对 象 按照 字母 顺序 被 加 入 到 队列 中 。 

3) From 半空 间 从 位 置 0 开始, To 半空 间 从 位 置 10 000 开始 。 

在 垃圾 回收 完成 之 后 , 每 个 保留 下 来 的 对 象 。 的 NewLocation( o) 的 值 是 什么 ? 


7.7 ” 短 停 顿 垃圾 回收 


简单 的 基于 跟踪 的 回收 器 是 以 全 面 停 顿 的 方式 进行 垃圾 回收 的 , 它 可 能 造成 用 户 程序 的 运 
行 的 长 时 间 的 停顿 。 我 们 可 以 每 次 只 做 部 分 垃圾 回收 工作 , 从 而 减少 一 次 停顿 的 长 度 。 我 们 可 
以 按照 时 间 来 分 割 工 作 任务 ， 使 垃圾 回收 和 增 变 者 的 运行 交错 进行 。 我 们 也 可 以 按照 空间 来 分 
THES, 每 次 只 完成 一 部 分 垃圾 的 回收 。 前 者 称 为 增 量 式 回收 (incremental collection), 后 者 
称 为 部 分 回收 (partial collection) 。 
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增 量 式 回收 器 将 可 达 性 分 析 任 务 分 割 成 为 若干 个 较 小 单元 , 并 允许 增 变 者 和 这 些 任务 单元 
交错 运行 。 可 达 集合 会 随 着 增 变 者 的 运行 发 生变 化 , 因此 增 量 式 回收 是 很 复杂 的 。 我 们 将 在 
7.7.1 节 看 到 , 寻找 一 个 稍微 保守 的 解决 方法 将 使 得 跟踪 更 加 高 效 。 

最 有 名 的 部 分 回收 算法 是 世代 垃圾 回收 (generational garbage collection) 。 它 根据 对 象 已 分 配 
时 间 的 长 短 来 划分 对 象 , 并 且 较 频繁 地 回收 新 创建 的 对 象 , 因为 这 些 对 象 的 生命 周期 往往 较 短 。 
另 一 种 可 选 的 算法 是 列车 算法 (train algorithm), 也 是 每 次 只 回收 一 部 分 垃圾 。 它 最 适合 回收 较 成 
熟 的 对 象 。 这 两 个 算法 可 以 联合 使 用 ,构成 一 个 部 分 回收 器 。 这 个 回收 器 使 用 不 同 的 方法 来 处 
理 较 新 的 和 较 成 熟 的 对 象 。 我 们 将 在 7. 7. 3 节 讨 论 有 关 部 分 回收 的 基本 算法 , 然后 详细 地 描述 世 
代 算 法 和 列车 算法 的 工作 原理 。 

来 自 于 增 量 回收 算法 和 部 分 回收 算法 的 思想 经 过 修改 , 可 以 用 于 构造 一 个 在 多 处 理 器 系统 
中 并 行 回收 对 象 的 算法 ， 见 7. 8. 1 节 。 

7.7.1 增 量 式 垃圾 回收 

增 量 式 回 收 器 是 保守 的 。 昌 然 垃圾 回收 器 一 定 不 能 回收 不 是 垃圾 的 对 象 ,， 但 是 它 并 不 一 定 
要 在 每 一 轮 中 回收 所 有 的 垃圾 。 我 们 将 每 次 回收 之 后 留 下 的 垃圾 称 为 漂浮 垃圾 (floating gar- 
bage) 。 我 们 当然 期 望 漂浮 垃圾 越 少 越 好 。 明 确 地 说 , 增 量 式 回收 器 不 应 该 遗漏 那些 在 回收 周期 
开始 时 就 已 经 不 可 达 的 垃圾 。 如 果 我 们 能 够 保证 做 到 这 一 点 ,那么 在 某 一 轮 中 没有 被 回收 的 垃 
圾 一 定 会 在 下 一 轮 中 被 回收 。 因 此 不 会 因为 这 个 垃圾 回收 方法 而 产生 内 存 泄 漏 问题 。 

换 名 话说, 增 量 式 垃 圾 回收 器 会 过 多 地 估算 可 达 对 象 集合 , 从 而 保证 安全 性 。 它 们 首先 以 不 
可 中 断 的 方式 处 理 程序 的 根 集 , 此 时 没有 来 自 增 变 者 的 干扰 。 在 找到 了 待 扫描 对 象 的 初始 集合 
之 后 , 增 变 者 的 动作 与 跟踪 步骤 交错 进行 。 在 这 个 阶段 , 任何 可 能 改变 可 达 性 的 增 变 者 动作 都 被 
简洁 地 记录 在 一 个 副 表 中 ,使 得 回收 器 可 以 在 继续 执行 时 做 出 必要 的 调整 。 如 果 在 跟踪 完成 之 
前 空间 就 被 耗 尽 , 那么 回收 器 将 不 再 允许 增 变 者 执行 ,并 完成 全 部 跟踪 过 程 。 在 任何 情况 下 , 当 
跟踪 完成 后 ; 空间 回收 以 原 语 的 方式 完成 。 

增 量 回收 的 准确 性 

一 旦 对 和 象 成 为 不 可 达 的 , 该 对 象 就 不 可 能 再 变 成 可 达 的 。 因 此 , 在 垃圾 回收 和 增 变 者 运行 
时 , 可 达 对 象 的 集合 只 可 能 : 

1) 因为 垃圾 回收 开始 之 后 的 某 个 新 对 象 的 分 配 而 增长 。 

2) 因为 失去 了 指向 已 分 配对 象 的 引用 而 缩小 。 

令 垃 圾 回收 开始 时 的 可 达 对 和 象 集合 为 RR, $ New 表示 在 垃圾 回收 期 间 创建 并 分 配 的 对 象 集 
合 , 并 令 Lost 表示 在 跟踪 开始 之 后 因为 引用 丢失 而 变 得 不 可 达 的 对 象 的 集合 。 那 么 当 跟 踪 完 成 
之 后 , 可 达 对 象 的 集合 为 : 





(R UNew) - Lost 
如 果 在 每 次 增 变 者 丢失 了 一 个 指向 某 个 对 象 的 引用 之 后 都 重新 确定 该 对 象 的 可 达 性 , 那么 
开销 会 变 得 很 大 , 因此 增 量 式 回收 器 并 不 试图 在 跟踪 结束 时 回收 所 有 的 垃圾 。 任 何 遗 留 下 的 垃 





圾 一 一 漂浮 垃圾 一 一 应 该 是 Lost 对 象 的 一 个 子 集 。 如 果 形式 化 地 描述 , 那 通过 跟踪 找到 的 对 象 
集合 $ 必须 满足 
(R UNew) - Lost CS C (R UNew) 
简单 的 增 量 式 跟踪 


我 们 首先 描述 一 种 用 来 找到 集合 R UNew 的 上 界 的 简单 跟踪 算法 。 在 跟踪 期 间 , 增 变 者 的 
行为 更 改 如 下 : 
。 在 垃圾 回收 开始 之 前 已 经 存在 的 所 有 引用 都 被 保留 。 也 就 是 说 , 在 增 变 者 覆 写 二 个 引用 
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之 前 , 它 原来 的 值 被 记 住 , 并 被 当 作 一 个 只 包含 这 个 引用 的 附加 待 扫描 对 象 。 

。 所 有 新 创建 的 对 象 立即 就 被 认为 是 可 达 的 , 并 被 放置 在 待 扫描 状态 中 。 

这 种 方案 是 保守 且 正 确 的 , 因为 它 找 出 了 RR 和 New。RR 是 在 垃圾 回收 之 前 可 达 的 所 有 对 象 的 
RE, New 是 所 有 新 分 配 的 对 象 的 集合 。 然 而 , 这 种 方案 付出 的 代价 也 很 高 , 因为 算法 需要 拦截 
所 有 的 写 运算 , 并 记 住 所 有 被 覆 写 的 引用 。 这 些 工作 中 的 一 部 分 是 不 必要 的 , 因为 它 涉及 的 对 象 
在 垃圾 回收 结束 时 可 能 已 经 是 不 可 达 的 。 如 果 我 们 能 够 探测 到 哪些 被 覆 写 的 引用 所 指 的 对 象 在 
本 轮 垃圾 回收 结束 时 不 可 达 , 我 们 就 可 以 避免 这 部 分 工作 , 同时 还 可 以 提高 算法 的 准确 性 。 下 一 
个 算法 在 这 两 个 方面 都 做 了 很 好 的 改进 。 

7.7.2 增 量 式 可 达 性 分 析 
如 果 我 们 让 增 变 者 和 一 个 像 算法 7. 12 那样 的 基本 跟踪 算法 交替 执行 ， 那么 一 些 可 达 对 象 可 
能 会 被 错 认 为 是 不 可 达 的 。 问题 的 根源 在 于 增 变 者 的 动作 可 能 会 违反 这 个 算法 的 一 个 关键 不 变 
A, 即 一 个 已 扫描 对 象 中 的 引用 只 能 指向 已 扫描 或 待 扫描 的 对 象 ， 这 些 引 用 不 可 以 指向 未 被 访问 
对 象 。 考 虑 下 面 的 场景 : 
1) 垃圾 回收 器 发 现 对 象 o, 可 达 并 扫描 ol 中 的 指针 ,因而 将 o, 置 于 已 扫描 状态 。 
2) 增 变 者 将 一 个 指向 未 被 访问 (但 可 达 ) 的 对 象 。 的 引用 存放 到 已 扫描 对 象 o Po EMM 
前 处 于 未 被 访问 或 待 扫描 状态 的 对 象 中 将 一 个 指向 o 的 引用 拷贝 到 g s 
3) 增 变 者 失去 了 对 象 o 中 指向 o WS. EMRE ACEH 0, 中 指向 6 的 引用 之 前 就 覆 
写 了 这 个 指针 ; 也 可 能 o 已 经 变 得 不 可 达 , 因此 一 直 没 有 进入 待 扫描 状态 ， 因此 它 内 部 的 指针 没 
有 被 扫描 过 。 
WE, o 可 以 通过 对 象 % 到 达 , 但 是 垃圾 回收 器 可 能 既 没 有 看 到 。 中 指向 。 的 引用 , 也 没有 
看 到 o 中 指向 。 的 引用 。 
要 得 到 一 个 更 加 准确 且 正 确 的 增 量 式 跟踪 方法 ， 关键 在 于 我 们 必须 注意 所 有 将 一 个 指向 当 
前 未 被 访问 对 象 的 引用 从 一 个 尚未 扫描 的 对 象 中 拷贝 到 已 扫描 对 象 中 的 动作 。 为 了 截获 可 能 有 
问题 的 引用 传递 , 算法 可 以 在 跟踪 过 程 中 按照 下 列 方式 修改 增 变 者 的 动作 : 
。 BAF. 截获 把 一 个 指向 未 被 访问 的 对 象 o。 的 引用 写 人 一 个 已 扫描 对 象 ol 的 运算 。 在 这 
种 情况 下 , 将。 作为 可 达 对 象 并 将 其 放 人 待 扫描 集合 。 另 一 种 方法 是 将 被 写 对 象 ol 放 回 
到 待 扫描 集合 中 ,使 得 我 们 可 以 再 次 扫描 它 。 

。 读 关 卡 。 截 获 对 未 被 访问 或 待 扫描 对 象 中 的 引用 的 读 运算 。 只 要 增 变 者 从 一 个 处 于 未 被 
访问 或 待 扫描 状态 中 的 对 象 读 取 一 个 指向 对 象 o 的 引用 时 ， 就 将 。 设 为 可 达 的 , 并 将 其 放 
和 人 待 扫 描 对 象 的 集合 。 

。 传递 关卡 。 截 获 在 未 被 访问 或 待 扫描 对 象 中 原 引 用 丢失 的 情况 。 只 要 增 变 者 覆 写 二 个 末 
被 访问 或 待 扫 描 对 象 中 的 引用 时 ， 保存 即将 被 覆 写 的 引用 并 将 其 设 为 可 达 的 , 然后 将 这 
个 引用 本 身 放 人 待 扫描 集合 。 

上 述 几 种 做 法 都 不 能 找到 最 小 的 可 达 对 象 集合 。 如 果 跟踪 过 程 确 定 一 个 对 象 是 可 达 的 ， 那 
么 这 个 对 象 就 一 直 被 认为 是 可 达 的 。 即使 在 跟踪 过 程 结束 之 前 所 有 指向 它 的 引用 都 被 覆 写 , E 
仍然 被 认为 是 可 达 的 。 也 就 是 说 ， 找到 的 可 达 对 象 集合 介 于 (RUNew) -Lost 与 (R UNew) 之 间 。 

上 面 给 出 的 可 选 算法 中 写 关 卡 方法 是 最 有 效 的 。 读 关卡 方法 的 代价 较 高 , 因为 一 般 来 说 读 
运算 要 比 写 运算 多 得 多 。 转 换 关 卡 没 有 什么 竞争 力 ， 因为 很 多 对 象 “ 英 年 早 逝 ”, 这 种 方法 会 保 
留 很 多 的 不 可 达 对 象 。 

写 关 卡 的 实现 

我 们 可 以 用 两 种 方式 来 实现 写 关卡 。 第 一 种 方式 是 在 增 变 阶段 记录 下 所 有 被 写 人 到 已 扫描 
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APRE, 我 们 可 以 将 这 些 引用 放 人 一 个 列表 。 如 果 不 考虑 从 列表 中 吻 除 重复 引用 , 列表 
的 大 小 和 对 已 扫 措 对 象 的 写 运算 的 数量 成 正比 。 注 意 , 列表 中 的 引用 本 身 可 能 在 后 来 又 被 覆 写 
H, 因此 可 能 被 忽略 。 

第 二 种 ,也 是 更 有 效 的 方式 是 记 住 写 运 算 发 生 的 位 置 。 我 们 可 以 用 被 写 位 置 的 列表 来 记录 它 
fi], 其 中 可 能 会 消除 重复 的 位 置 。 请 注意 , 只 要 所 有 被 写 的 位 置 都 被 重新 扫描 , 那么 是 否 精确 记录 
被 写 的 位 置 并 不 重要 。 因 此 , 有 多 种 技术 支持 我 们 记录 较 少 的 有 关 被 覆 写 的 确切 位 置 的 细节 。 

。 我 们 可 以 只 记录 包含 了 被 写字 段 的 对 象 , 而 不 需要 记录 被 写 的 精确 地 址 或 者 被 写 的 对 象 

及 字段 。 

。 我 们 可 以 将 地 址 空间 分 成 固定 大 小 的 块 , 这 些 块 被 称 为 卡片 (eard)， 并 使 用 一 个 位 数组 来 

记录 曾经 被 写 人 的 卡片 。 

。 我 们 可 以 选择 记录 下 包含 子 被 写 位 置 的 页 。 我 们 可 以 只 将 那些 包含 了 已 扫描 对 象 的 页 置 

为 被 保护 状态 。 那 么 ,不 需 执行 任何 显 式 的 指令 就 可 以 检测 到 任何 对 已 扫描 对 象 的 写 运 
算 。 因 为 这 样 的 写 运算 会 引发 一 个 保护 错误 , 操作 系统 将 引发 一 个 程序 异常 。 

一 般 来 说 , 通过 增 大 被 覆 写 位 置 的 记录 粒度 就 可 以 减少 所 需 的 存储 空间 , 但 代价 是 增加 了 需 
要 再 次 执行 的 扫描 工作 量 。 在 第 一 种 方案 中 , 无 论 实际 上 修改 了 被 修改 对 象 中 的 哪个 引用 , 该 对 
象 中 的 所 有 引用 都 要 进行 重新 扫描 。 在 后 两 种 方案 中 , 在 被 修改 的 卡片 或 页 中 的 所 有 可 达 对 象 
都 要 在 跟踪 过 程 的 最 后 进行 重新 扫描 。 

结合 增 量 和 拷贝 技术 

上 述 的 方法 对 于 标记 - 清扫 式 垃 圾 回收 来 说 已 经 足够 了 。 因 为 拷贝 回收 和 增 变 者 的 相互 影 
响 ， 它 的 实现 要 稍微 复杂 一 点 。 处 于 已 扫描 或 待 扫描 状态 中 的 对 象 有 两 个 地 址 ,一 个 位 于 From 
半空 间 , 另 一 个 位 于 To 半空 间 。 和 算法 7. 16 一 样 ， 我 们 必须 保存 一 个 从 对 象 的 旧地 址 到 其 重新 
定位 之 后 的 地 址 的 映射 。 

我 们 可 以 选择 两 种 更 新 引用 的 方法 。 第 一 种 方法 是 , 我 们 可 以 让 增 变 者 在 From 空间 中 完成 
所 有 的 运算 ,只 是 在 垃圾 回收 结束 的 时 候 才 更 新 所 有 的 指针 ,并 将 所 有 的 内 容 都 拷贝 到 To 空间 。 
第 三 种 方法 是 , 我 们 可 以 让 程序 直接 改变 To 空间 中 的 表示 。 当 增 变 者 对 一 个 指向 From 空间 的 指 
针 解 引用 时 ,如 果 在 To 空间 中 存在 对 应 于 该 指针 的 新 位 置 , 那么 这 个 指针 就 被 翻译 成 这 个 新 位 
置 。 所 有 这 些 指针 在 最 后 都 需要 被 转换 成 指向 To 空间 的 新 位 置 。 

7.7.3 ;部 分 回收 概述 

见 个 基本 的 事实 是 ,对象 通常 “4 英 年 早 逝 ”。 人 们 发 现 , 通常 80% ~98% 的 新 分 配对 象 在 儿 
百 万 条 指令 之 内 ,或 者 在 再 分 配 了 另外 的 几 兆 字 节 之 前 就 消亡 了 。 也 就 是 说 ,对 象 通常 在 垃圾 回 
收 过 程 启动 之 前 就 已 经 变 得 不 可 达 了 。 因 此 , 频繁 地 对 新 对 象 进行 垃圾 具有 相当 高 的 性 价 比 。 

然而 , 经 历 了 一 次 回收 的 对 象 很 可 能 在 多 次 回收 之 后 依然 存在 。 在 迄今 为 止 描述 的 垃圾 回 
收 器 中 , 同一 个 成 熟 对 象 会 在 各 轮 垃圾 回收 中 被 发 现 是 可 达 的 。 如 果 使 用 拷贝 回收 器 ,这些 对 象 
会 在 各 轮 垃圾 回收 中 被 一 次 次 地 拷贝 。 世 代 回 收 在 包含 最 年 轻 对 象 的 堆 区 域 中 的 回收 工作 最 为 
频繁 ,所 以 它 通 常 可 以 用 相对 较 少 的 工作 量 回收 大 量 的 垃圾 。 另 一 方面 ,列车 算法 没有 在 年 轻 对 
象 上 花费 太 多 的 时 间 , 但 是 它 能 够 有 效 限制 因 垃 圾 回收 而 造成 的 程序 停顿 时 间 。 因 此 , 将 这 两 个 
策略 合并 的 好 方法 是 对 年 轻 对 象 使 用 世代 回收 , 而 一 旦 一 个 对 象 变 得 相当 成 熟 , 则 将 它 “ 提 升 ” 
到 二 个 由 列车 算法 管理 的 独立 堆 区 中 。 

我 们 把 将 在 一 轮 部 分 回收 中 被 回收 的 对 象 集合 称 为 目标 (target) 集 ， 而 将 其 他 对 象 称 为 稳定 
(stable) 集 。 在 理想 状态 下 , 一 个 部 分 回收 器 应 该 回收 目标 集中 所 有 无 法 从 根 集 到 达 的 对 象 。 然 
而 ; 这 么 做 需要 跟踪 所 有 的 对 象 , 而 这 正 是 我 们 首先 要 试图 避免 的 事情 。 实 际 上 ， 部 分 回收 器 只 
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是 保守 地 回收 那些 无 法 从 根 集 和 稳定 集 到 达 的 对 象 。 因 为 稳定 集中 的 一 些 对 象 自身 也 是 不 可 达 
的 , 我 们 可 能 会 把 目标 集中 一 些 实际 上 不 存在 从 根 集 开始 的 路 径 的 对 象 当成 可 达 对 象 。 

我 们 可 以 修改 7. 6.1 节 和 7. 6.4 节 中 描述 的 垃圾 回收 器 , 改变 “ 根 集 ”的 定义 , 使 之 以 部 分 回 
收 的 方式 工作 。 现 在 根 集 指 的 不 仅 是 存放 在 寄存 器 、 栈 和 全 局 变量 中 的 对 象 ， 它 还 包括 所 有 指向 
目标 集 对 象 的 稳定 集中 的 对 象 。 从 一 个 目标 对 象 指向 其 他 目标 对 象 的 引用 按照 以 前 的 方法 进行 
跟踪 ,以 找到 所 有 的 可 达 对 象 。 我 们 可 以 忽略 所 有 指向 稳定 对 象 的 指针 ,因为 在 本 轮 部 分 回收 中 
这 些 对 象 被 认为 是 可 达 的 。 

为 了 找 出 那些 引用 了 目标 对 象 的 稳定 对 象 , 我 们 可 以 采用 和 增 量 垃圾 回收 所 用 技术 类 似 的 
方法 。 在 增 量 回收 中 , 我 们 需要 在 跟踪 过 程 中 记录 所 有 对 从 已 扫描 对 象 到 未 被 访问 对 象 的 引用 
的 号 运算 。 在 这 里 ,我 们 需要 记录 下 增 变 者 的 整个 运行 过 程 中 对 从 稳定 对 象 到 目标 对 象 的 引用 
的 写 运算 。 只 要 增 变 者 将 一 个 指向 某 个 目标 对 象 的 引用 保存 到 稳定 对 象 中 时 ,我 们 要 么 记录 下 
这 个 引用 ,要 么 记录 下 写 人 的 位 置 。 我 们 把 保存 了 从 稳定 对 象 到 目标 对 象 的 引用 的 对 象 集合 称 
为 被 记忆 集合 (remembered set) 。 如 7.7.2 节 中 讨论 的 , 我 们 可 以 只 记录 下 包含 了 被 写 和 对象 所 
在 的 卡片 或 页 , 以 压缩 被 记忆 集合 的 表示 。 

部 分 垃圾 回收 器 通常 被 实现 为 拷贝 垃圾 回收 器 。 通 过 使 用 链表 来 跟踪 可 达 对 象 , 也 可 以 实 
现成 为 非 拷贝 回收 器 。 下 面 描述 的 “世代 "方案 是 一 个 关于 如 何 将 拷贝 和 部 分 回收 相 结合 的 例子 。 
7.7.4 世代 垃圾 回收 

世代 垃圾 回收 ( generational garbage collection) 是 一 种 充分 利用 了 大 多 数 对 象 “ 英 年 早 逝 "的 特 
性 的 有 效 方法 。 在 世代 垃圾 回收 中 ,， 堆 区 被 分 成 一 系列 小 的 区 域 。 我 们 将 用 0,， 1, 25, 及 对 它 
们 进行 编号 , 序号 越 小 的 区 域 存放 的 对 象 越 年 轻 。 对 象 首先 在 0 区 域 被 创建 。 当 这 个 区 域 被 填 江 
时 , 它 的 垃圾 被 回收 , 且 其 中 的 可 达 对 象 被 移 到 1 区 。 现 在 , 0 区 又 成 为 空 的 , 我们 继续 把 新 对 
象 分 配 到 这 个 区 域 。 当 0 区 再 次 被 填 满 8, 它 的 垃圾 又 被 回收 ， 且 它 的 可 达 对 象 被 拷贝 到 1 区 ， 
与 之 前 被 拷贝 的 对 象 合 在 一 起 。 这 个 模式 一 直 被 重复 , 直到 1 区 也 被 填 满 为 止 。 此 时 应 对 0 区 和 
1 区 应 用 垃圾 回收 。 ; 

一 般 来 说 ,每 一 轮 垃圾 回收 都 是 针对 序号 小 于 等 于 某 个 i 的 区 域 进行 的 , 应 该 将 ; 选择 为 当 
前 被 填 满 区 域 的 最 高 编号 。 每 当 一 个 对 象 经 历 了 一 轮回 收 ( 即 它 被 确定 为 可 达 的 ), 它 就 从 它 当 
前 所 在 区 域 被 提升 到 下 一 个 较 高 的 区 域 , 直到 它 到 达 最 老 的 区 域 ， 即 序号 为 的 区 域 。 

使 用 7. 7.3 节 中 介绍 的 术语 ， 当 区 域 i 及 更 低 区 域 中 的 垃圾 被 回收 时 ,从 0 到 i 的 区 域 组 成 
THER, 所 有 序号 大 于 i 的 区 域 组 成 了 稳定 集 。 为 了 为 各 种 可 能 的 部 分 回收 找到 根 集 , 我 们 为 
往 个 区 域 i 保持 了 一 个 被 记忆 集 , 该 集合 由 指向 区 域 i 中 对 象 且 位 于 大 于 i 的 区 域 中 的 所 有 对 象 
组 成 。 在 i 上 激活 的 一 次 部 分 回收 的 根 集 包括 了 区 域 i 及 更 低 区 域 的 被 记忆 集 。 

在 这 个 方案 中 ,只 要 我 们 对 i 进行 回收 , 所 有 序号 小 于 i 的 区 域 也 将 进行 垃圾 回收 。 有 两 个 
原因 促使 我 们 采用 这 个 策略 : 

1) 因为 较 年 轻 的 世代 往往 包含 较 多 的 垃圾 ,也 就 更 频繁 地 被 回收 。 所 以 , 我们 可 以 将 它们 
和 较 老 的 世代 一 起 回收 。 

2) 根据 这 种 策略 ， 我 们 只 需要 记录 从 较 老 世代 指向 较 新 世代 的 引用 。 也 就 是 说 ， 对 最 年 轻 
世代 的 对 象 进行 写 运算 ， 以 及 将 对 象 提升 到 下 一 世代 时 都 不 需要 更 新 任何 被 记忆 集 。 如 果 我 们 





O 从 技术 上 来 说 ,区 域 不 会 被 填 满 ， 因 为 如 果 需 要 ， 存储 管理 器 可 以 使 用 附加 的 磁盘 块 对 它们 进行 扩展 。 然而 ， 除 
了 最 后 一 个 区 域 ,其 他 区 域 的 尺寸 通常 都 有 一 个 界限 。 我 们 将 把 到 达 这 一 界限 称 为 “ 填 满 ”。 
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对 某 个 区 域 进行 回收 , 但 是 不 回收 某 个 较 年 轻 的 世代 , 那么 后 者 将 成 为 稳定 集 的 一 部 分 。 我 们 将 
不 得 不 同时 记录 从 较 年 轻 世 代 指 向 较 年 老 世代 的 引用 。 

总 而 言 之 , 这 种 方案 更 频繁 地 回收 较 年 轻 的 世代 , 并 且 因 为 “对 象 英 年 早 逝 ”， 对 于 这 些 世 代 
进行 垃圾 回收 的 效 费 比 特别 高 。 对 较 老 世代 的 垃圾 回收 则 要 花 更 多 的 时 间 ， 因为 它 包括 了 对 所 
有 较 年 轻 世代 的 回收 , 同时 它们 包含 的 垃圾 也 相应 减少 。 虽 然 如 此 ， 较 老 世代 还 是 需要 每 过 一 段 
时 间 进 行 二 次 回收 ,以 删除 不 可 达 对 象 。 最 老 的 世代 保存 了 最 成 熟 的 对 象 ， 对 这 些 对 象 的 回收 是 
最 昂贵 的 , 因为 它 相当 于 一 次 完整 的 回收 。 也 就 是 说 ， 世代 回收 器 偶尔 也 需要 执行 完整 的 跟踪 步 
又 , 因此 也 会 在 程序 运行 时 引信 较 长 时 间 的 停顿 。 接 下 来 将 讨论 另 一 种 只 处 理 成 熟 对 象 的 方法 。 
7.7.5 WEAK 

尽管 世代 方法 在 处 理 年 轻 对 象 时 非常 高 效 , 但 它 在 处 理 成 熟 对象 时 却 相对 低 效 ， 因 为 每 当 一 
个 垃圾 回收 过 程 涉及 某 个 成 熟 对 象 时 , 该 对 象 都 会 被 移动 ,而 且 它 们 不 太 可 能 变 成 垃圾 。 另 一 种 
被 称 为 列车 算法 的 增 量 式 回收 方法 用 于 改进 对 成 熟 对 象 的 处 理 。 它 可 以 用 来 回收 所 有 的 垃圾 。 
但 是 更 好 的 方法 是 使 用 世代 方法 来 处 理 年 轻 的 对 象 , 只 有 当 这 些 对 象 经 历 了 几 轮 世代 回收 之 后 
仍然 存在 , 才 将 它们 提升 到 另 一 个 由 列车 算法 管理 的 堆 区 。 列车 算法 的 另 一 个 优点 是 我 们 永远 
不 需要 进行 全 面 的 垃圾 回收 过 程 , 而 在 世代 垃圾 回收 中 却 仍然 必须 偶尔 那样 做 。 

为 了 描述 列车 算法 的 动机 , 我 们 首先 看 一 个 简单 的 例子 。 该 例子 告诉 我 们 为 什么 在 世代 方法 中 
必须 偶尔 进行 一 轮 全 面 的 垃圾 回收 。 图 7-29 给 出 了 位 于 两 个 区 域 i 和 j 中 的 两 个 相互 连接 的 对 象 ， 
其 中 j>i。 因为 这 两 个 对 象 都 有 来 自 其 区 域 之 外 的 指针 ,只 对 区 域 ; 或 只 对 区 域 ] 进行 回收 都 不 能 回 
收 这 两 个 对 象 。 然 而 , 它们 可 能 实际 上 是 一 个 循环 垃圾 结构 中 的 一 部 分 , 没有 外 部 链接 指向 该 垃圾 
结构 。 一 般 来 说 , 这 里 显示 的 对 象 之 间 的 “链接 ”可 能 涉及 很 多 对 象 和 一 条 很 长 的 引用 链 。 
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图 7-29 一 个 跨越 区 域 的 可 能 是 循环 垃圾 的 环 状 结构 


在 世代 垃圾 回收 中 , 我 们 最 终 会 回收 区 域 j, 并 且 因 为 i<j, 我 们 同时 还 会 回收 i 区 域 。 那 么 
这 个 循环 结构 将 被 完全 包含 在 正在 被 回收 的 堆 区 中 , 我 们 就 可 以 确定 它 是 否 真 的 是 垃圾 。 然 而 ， 
如 果 我 们 从 没有 进行 过 一 轮 包括 了 i 和 j 的 回收 , 那么 我 们 就 会 磁 到 循环 垃圾 的 问题 ， 也 就 是 我 
们 在 使 用 引用 计数 进行 垃圾 回收 时 碰 到 的 问题 。 

列车 算法 使 用 固定 大 小 的 被 称 为 车 厢 ( ear) 的 区 域 。 当 没有 对 象 比 磁盘 块 更 大 时 ， 一 他 车 亲 可 
以 是 一 个 磁 稻 块 ， 否 则 可 以 将 车 厢 的 尺寸 设 得 更 大 。 但 是 车 厢 的 大 小 一 旦 确定 就 不 再 变化 。 多 节 车 
厢 被 组 织 成 列车 (train) 。 一 辆 列车 中 的 车 厢 数 量 没有 限制 , 上 且 列 车 的 数量 也 没有 限制 。 车 叮 之 间 按 
照 词典 顺序 进行 排序 : 首先 以 列车 号 排序 , 在 同一 列车 中 则 以 车 厢 号 排序 ， 如 图 7-30 所 示 。 


列车 1 %1 oh 
列车 2 21 | | 车 厢 22 | | 车 厢 23 | | 24 


列车 3 $H | | 车 而 32 | [#33 | 














图 7-30 列车 算法 中 的 堆 区 组 织 
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列车 算法 有 两 种 回收 垃圾 的 方式 : 
。 在 一 个 增 量 式 垃圾 回收 步骤 中 , 按照 词典 顺序 排列 的 第 一 节 车 厢 ( 即 尚 存 的 第 一 辆 列车 中 
尚 存 的 第 一 节 车 厢 ) 首先 被 回收 。 因 为 我 们 保留 了 一 个 来 自 该 车 厢 之 外 的 所 有 指针 的 “被 
记忆 ?列表 ,所 以 这 一 步 类 似 于 世代 算法 中 针对 第 一 个 区 域 的 回收 步骤 。 这 里 我 们 确定 出 
没有 任何 引用 的 对 象 ; 以 及 完全 包含 在 这 节 车 厢 里 的 垃 瓜 循环 。 该 车 厢 中 的 可 达 对 象 总 
是 被 移 至 其 他 的 某 个 车 厢 中 , 因此 每 个 被 回收 过 的 车 厢 都 变 成 空 车 厢 ， 可 以 从 这 辆 列车 
中 删除 。 
。 有 时 , 第 一 辆 列车 没有 外 部 引用 。 也 就 是 说 , 没有 从 根 集 指向 该 列车 中 任何 车 厢 的 指 
针 , 并 且 各 节 车 厢 中 的 被 记忆 集中 只 有 来 自 本 列车 的 其 他 车 厢 的 引用 ,没有 来 自 其 他 
列车 的 引用 。 在 这 种 情况 下 , 该 列车 就 是 一 个 巨大 的 循环 垃圾 集合 , 我 们 可 以 删除 整 
辆 列车 。 
被 记忆 集 
现在 我 们 给 出 列车 算法 的 细节 。 每 节 车 厢 有 一 个 被 记忆 集 ， 它 由 指向 该 车 厢 中 对 象 的 引用 
组 成 , 这 些 引 用 来 自 : 
1) 同一 辆 列车 中 序号 较 高 的 车 厢 中 的 对 象 ， 以 及 
2) 序号 较 高 的 列车 中 的 对 象 。 
此 外 , 每 辆 列车 有 一 个 被 记忆 和 集 , 它 由 来 自 较 高 序号 列车 中 的 引用 组 成 。 也 就 是 说 , 一 个 列 
车 的 被 记忆 集 是 它 内 部 的 所 有 车 月 的 被 记忆 集 的 并 集 , 但 是 不 包含 列车 内 部 的 引用 。 因 此 ; 可 以 
将 车 厢 的 被 记忆 集 划 分 成 “内 部 ”( 同 一 列车 ) 和 “外 部 ”( 其 他 列车 ) 两 个 部 分 , 同时 表示 这 两 种 不 
同类 型 的 被 记忆 集 。 
注意 , 指向 这 些 对 象 的 引用 可 以 来 自 各 个 地 方 , 不 只 是 来 自 按 字典 顺序 排列 的 序号 较 高 的 车 
厢 。 然 而 ,算法 中 的 两 种 垃圾 回收 过 程 分 别处 理 第 一 辆 列车 的 第 一 节 车 厢 和 整个 第 一 辆 列车 。 
因此 ，, 当 在 垃圾 回收 中 需要 使 用 被 记忆 集 的 时 候 , 已 经 没有 更 早 的 地 方 可 以 有 引用 到 达 被 处 理 的 
车 厢 或 者 列车 。 因 此 记录 下 指向 较 高 序号 车 厢 的 引用 没有 什么 意义 。 当 然 , 我 们 必须 认真 、 正 确 
地 管理 被 记忆 集 , 只 要 增 变 者 改变 了 任何 对 象 中 的 引用 ,就 需要 相应 地 改变 被 记忆 和 集 。 
管理 列车 
我 们 的 目标 是 找 出 第 一 辆 列车 中 所 有 非 循 环 垃圾 的 对 象 。 此 时 , 第 一 辆 列车 要 么 只 包含 了 
循环 垃圾 , 因此 将 在 下 一 轮 垃圾 回收 时 被 回收 ; 要 么 其 中 的 垃圾 不 是 循环 的 , 那么 它 的 车 厢 就 可 
以 被 逐个 回收 。 
因为 对 一 辆 列车 中 的 车 厢 数 目 没 有 限制 , 每 当 我 们 需要 更 多 空间 时 , 在 原则 上 我 们 可 以 直接 
向 一 辆 列车 中 加 入 新 的 车 厢 。 但 是 ,我们 偶尔 也 需要 创建 出 新 的 列车 。 例 如 , 我 们 可 以 设 定 每 创 
建 上 个 对 象 之 后 就 新 建 一 辆 列车 。 也 就 是 说 ， 当 最 后 一 辆 列车 的 最 后 车 厢 中 还 有 足够 的 空间 时 ， 
新 创建 的 对 象 一 般 会 被 放置 在 这 节 车 厢 中 ; 如 果 该 车 厢 中 没有 足够 空间 , 该 对 象 就 会 被 放 到 一 个 
即将 被 加 到 最 后 一 个 车 厢 之 后 的 新 车 厢 中 。 然 而 , 我 们 会 定期 新 建 一列 只 有 一 节 车 厢 的 列车 , 并 
将 新 对 象 放 人 其 中 。 
单 节 车 厢 的 垃圾 回收 
列车 算法 的 核心 是 我 们 如 何在 一 轮 垃圾 回收 中 处理 第 一 辆 列车 的 第 一 节 车 厢 。 一 开始 ,可 
达 集 包括 了 该 车 厢 中 被 来 自 根 集 的 引用 指向 的 对 象 , 以 及 被 该 车 厢 的 被 记忆 集中 的 引用 指向 的 
对 象 。 然 后 ,我 们 像 标记 = 清扫 式 回收 器 那样 扫描 这 些 对 象 , 但 是 不 会 扫描 任何 可 达 的 位 于 被 回 
收 车 厢 之 外 的 对 象 。 在 这 次 跟踪 之 后 ， 该 车 厢 中 的 某 些 对 象 可 能 被 确定 为 垃圾 。 因 为 无 论 如何 
整 节 车 厢 都 将 消失 ,因此 不 必 回 收 它们 的 空间 。 
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然而 , 该 车 厢 中 很 可 能 还 有 一 些 可 达 对 象 , 这 些 对 象 必须 被 移 到 其 他 地 方 。 移 动 一 个 对 象 的 
规则 如 下 : 

。 如 果 被 记忆 集中 有 一 个 来 自 其 他 列车 的 引用 (该 列车 的 序号 高 于 被 回收 车 厢 所 在 列车 的 

FE), 那么 将 这 个 对 象 移 到 这 些 列车 中 的 某 一 辆 中 。 如 果 在 发 出 一 个 引用 的 某 辆 列车 中 
能 够 找到 足够 的 空间 ,就 将 该 对 象 移动 这 辆 列车 的 某 节 车 厢 中 。 如 果 找 不 到 空间 , 它 就 
进入 一 个 新 的 、 最 末端 的 车 厢 。 

。 如 果 没 有 来 自 其 他 列车 的 引用 , 但 是 存在 来 自 根 集 或 第 一 辆 列车 的 引用 , 那么 就 将 此 对 

象 移 到 同一 列车 中 的 其 他 车 厢 中 。 如 果 没 有 足够 空间 ， 就 创建 一 个 新 的 车 厢 放 到 列车 的 
未 端 。 如 果 有 可 能 ,挑选 有 一 个 指向 该 对 象 的 引用 的 车 厢 , 以 尽快 把 循环 结构 放 到 同一 
TEMP, 

在 从 第 一 节 车 厢 中 移出 了 所 有 可 达 对 象 之 后 , 我 们 就 可 以 删除 这 节 车 厢 。 

上 面 的 规则 还 存在 一 个 问题 。 为 了 保证 所 有 的 垃圾 最 终 都 会 被 回收 , 我 们 需要 保证 每 辆 列 
车 迟早 会 变 成 第 一 辆 列车 , 并 且 如 果 这 辆 列车 不 是 循环 垃圾 , 那么 此 列车 中 的 所 有 车厢 最 后 都 会 
被 删除 , 且 该 列车 每 次 至 少 会 减少 一 节 车 厢 。 然 而 , 根据 上 面 的 第 二 个 规则 , 回收 第 一 辆 列车 的 
第 一 节 车 厢 时 可 能 会 产生 一 个 位 于 最 后 的 新 车 厢 。 这 个 过 程 不 会 创建 出 两 个 或 更 多 的 新 车 厢 ， 
因为 第 一 节 车 厢 中 的 所 有 对 象 一 定 能 够 被 一 起 放 到 最 后 的 新 车 厢 中 。 然 而 , 是否 会 出 现 这 种 情 
况 ,， 一 辆 列车 的 每 一 个 回收 步 又 都 产生 一 节 新 车 厢 ， 以 致 玫 我 们 永远 不 能 回收 完 这 辆 列车 ， 结 果 
永远 不 能 继续 处 理 另 一 辆 列车 ? 

遗憾 的 是 , 这 种 情况 是 可 能 出 现 的 。 如 果 我 们 有 一 个 大 型 的 、 循 环 的 非 垃 圾 的 结构 ,并 且 增 
变 者 改变 引用 的 方式 使 得 我 们 在 回收 一 节 车 厢 时 一 直 没 有 在 被 记忆 集中 看 到 任何 来 自 较 高 序号 
列车 的 引用 ,就 会 出 现 上 述 问 题 。 只 要 在 回收 一 节 车 厢 时 有 一 个 对 象 从 这 个 列车 中 移出 ， 问 题 就 
解决 了 , 因为 没有 新 的 对 象 会 被 加 入 到 第 一 辆 列车 中 , 所 以 第 一 辆 列车 中 的 所 有 对 象 最 终 一 定 会 
被 全 部 移出 。 然 而 , 有 可 能 在 某 个 阶段 我 们 根本 回收 不 到 任何 垃圾 , 这 样 就 会 存在 出 现 循环 的 风 
险 : 有 可 能 一 直 只 对 当前 的 第 一 辆 列车 进行 垃圾 回收 。 

为 了 避免 出 现 这 个 问题 ,只 要 我 们 遇 到 一 个 无 效 (futile) 垃 圾 回收 , 我 们 就 需要 改变 做 法 。 
所 谓 无 效 垃圾 回收 是 指 , 在 回收 一 节 车 厢 时 没有 一 个 对 象 可 以 作为 垃圾 删除 或 者 被 移动 到 另 一 
辆 列车 中 。 在 这 种 “ 铠 慌 模式 ”下 , 我们 做 出 两 个 变化 : 

1) 当 指 向 第 一 辆 列车 中 的 某 个 对 象 的 某 个 引用 被 覆 写 时 , 我 们 将 这 个 引用 保留 为 根 集 的 一 
个 新 成 员 。 

2) 在 进行 垃圾 回收 时 , 如 果 第 一 节 车 厢 中 的 一 个 对 象 有 来 自 根 集 的 引用 , 其 中 包括 在 第 1 
点 中 设置 的 哑 引 用 , 那么 即使 该 对 象 没 有 来 自 其 他 列车 的 引用 , 我 们 还 是 将 它 移 至 男 一 辆 列车 。 
只 要 不 是 移 到 第 一 辆 列车 , 移 到 哪 辆 列车 并 不 重要 。 

按照 这 个 方法 , 如 果 有 一 个 指向 第 一 辆 列车 的 对 象 的 引用 来 自 该 列车 之 外 , 在 我 们 回收 每 节 
车 厢 时 都 会 考虑 这 些 引 用 , 并 且 最 终 必然 会 有 一 些 对 和 象 从 那 辆 列车 移 除 。 然 后 , 我 们 就 可 以 脱离 
恐慌 模式 , 继续 正常 处 理 , 确保 当前 的 第 一 辆 列车 一 定 要 比 以 前 小 。 

7.7.6 7.7 节 的 练习 

练习 7. 7. 1: 假设 图 7.20 中 的 对 象 网 络 由 一 个 增 量 式 算法 进行 管理 。 该 算法 和 Baker 算法 一 
样 使 用 四 个 列表 Unreached、Unscanned、Scanned 和 Free。 更 明确 地 说 , 列表 Unscanned 按照 队列 进 
行 管理 。 当 扫描 一 个 对 象 时 ,如 果 有 多 个 对 象 要 被 放 进 这 个 列表 中 , 我 们 按照 字母 顺序 加 入 它 
们 。 同 时 假设 我 们 使 用 写 关 卡 来 保证 没有 可 达 对 象 被 当 作 垃圾 。 在 开始 时 , A 和 号 在 Unscanned 
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列表 中 , 假设 下 列 事件 发 生 : 

1) A RAH. 

2) 指针 AD RBS H AH, 

3) B RHH 

4) D 被 扫描 。 

5) 指针 B>C RBS A BI, 

假设 没有 更 多 的 指针 被 覆 写 , 模拟 整个 增 量 式 垃圾 回收 过 程 。 哪 些 对 象 是 垃圾 ? 哪些 对 象 
被 放 在 了 列表 Free 中 ? 

练习 7.7.2:; 按照 如 下 假设 重复 练习 7.7.1: 

1) 事件 (2) 和 (5) 的 顺序 互 换 。 

2) 事件 (2) 和 (5) 在 (1)、(3) 和 (4) 之 前 发 生 。 

练习 7.7. 3: 假设 堆 区 恰好 由 图 7-30 中 显示 的 三 辆 列车 ( 共 九 节 车 厢 ) 组 成 ( 即 忽略 其 中 的 省 
IS). AXA 4A 12, 23 #132 的 引用 指向 车 厢 11 中 的 对 象 o。 当 我 们 对 车 厢 11 进行 垃圾 回 
We, 对象。 最 后 在 什么 地 方 ? 

练习 7.7.4: 在 下 列 情况 下 重复 练习 7.7.3。 假设 对 象 o 

1) 只 有 来 自 车 月 22 和 31 的 引用 。 

2) 没有 来 自 车 厢 11 之 外 的 指针 & 

练习 7.7.5: 假设 堆 区 恰好 由 图 7-30 中 显示 的 三 辆 列车 ( 共 九 节 车 厢 ) 组 成 ( 即 忽 略 其 中 的 省 
略 号 )。 当 前 我 们 处 于 恺 懂 模 式 。 车厢 11 中 的 对 象 ol 只 有 一 个 来 自 车 厢 12 中 的 对 象 o 的 引用 。 
这 个 引用 被 覆 写 了 。 当 我 们 对 车 厢 11 进行 垃圾 回收 时 , oj 会 发 生 什么 事情 ? 


7.8 垃圾 回收 中 的 高 级 论题 


我 们 简要 地 介绍 下 面 的 四 个 论题 , 结束 我 们 对 垃圾 回收 的 研究 : 

1) 并 行 环 境 下 的 垃圾 回收 。 

2) 对 象 的 部 分 重 定位 。 

3) 针对 类 型 不 安全 的 语言 的 垃圾 回收 。 

4) 程序 员 控 制 的 垃圾 回收 和 自动 垃圾 回收 之 间 的 交互 。 

7.8.1 并 行 和 并 发 垃圾 回收 

当 将 垃圾 回收 应 用 到 并 发 或 多 处 理 器 机 器 上 运行 的 应 用 程序 时 , 这 一 工作 变 得 更 具有 挑战 
性 。 对 于 服务 器 应 用 , 在 同一 时 刻 运行 成 千 上 万 个 线程 是 常 有 的 事情 ; 其 中 的 每 个 线程 都 是 一 个 
增 变 者 。 堆 区 通常 会 包含 几 千 兆 的 存储 。 

可 处 理 大 规模 系统 的 垃圾 回收 算法 必须 充分 利用 系统 的 多 个 处 理 器 。 如 果 一 个 培 圾 回收 
器 使 用 多 个 线程 ,我们 就 称 其 为 并 行 的 (parallel) 。 如 果 回 收 器 和 增 变 者 同时 运行 ,就 说 它 是 
并 发 的 (concurrent) 。 

我 们 将 描述 一 个 并 行 的 且 基 本 上 并 发 的 垃圾 回收 器 。 它 使 用 一 个 并 发 且 并 行 的 阶段 来 完成 
大 部 分 的 跟踪 工作 , 然后 执行 一 个 全 面 停顿 式 的 步骤 来 保证 找到 所 有 的 可 达 对 象 并 回收 存储 空 
间 。 这 个 算法 在 本 质 上 并 没有 引入 新 的 有 关 垃 圾 回收 的 基本 概念 , 它 说 明了 我 们 如 何 将 曾经 描 
述 的 思想 组 合 起 来 , 创造 出 一 个 解决 并 发 、 并行 的 垃圾 回收 问题 的 完整 解决 方案 。 然 而 ;并行 执 
行 的 本 质 会 带 来 一 些 新 的 实现 问题 。 我 们 将 讨论 这 个 算法 如 何 使 用 一 个 相当 常见 的 工作 队列 模 
型 , 在 并 行 计算 过 程 中 协调 多 个 线程 。 

为 了 理解 这 个 算法 的 设计 思想 , 我们 必须 牢记 这 个 问题 的 规模 。 即 使 二 个 并 行 应 用 的 根 集 
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也 要 比 普通 的 应 用 大 很 多 , 它 由 每 个 线程 的 栈 、 寄 存 器 集 和 全 局 可 访问 变量 组 成 。 堆 区 存储 的 数 
量 也 非常 大 , 可 达 数 据 的 数量 同样 也 很 大 。 增 变 过 程 发 生 速率 也 比 一 般 的 应 用 高 很 多 。 

为 了 减少 停顿 时 间 , 我 们 可 以 采用 原本 为 增 量 式 分 析 而 设计 的 基本 思想 ,使 垃圾 回收 和 状态 
增 变 过 程 重合 执行 。 请 回顾 一 下 , 正如 7.7 节 所 讨论 的 , 一 个 增 量 式 分 析 完 成 下 列 三 个 步 又 : 

1) 找到 根 集 。 这 个 步骤 通常 是 以 原 语 方式 完成 的 , 即 增 变 者 暂时 停止 运行 。 

2) 增 变 者 的 执行 和 对 可 达 对 象 的 跟踪 交替 进行 。 在 这 个 阶段 ， 每 次 有 一 个 增 变 者 写 人 一 个 
从 已 拉 描 对 象 指向 未 被 访问 对 象 的 引用 时 , 我 们 都 会 记录 这 个 引用 。 如 7.7.2 节 中 讨论 的 , 我 们 
可 以 选择 多 种 粒度 来 记录 这 些 引用 。 在 本 节 中 , 我 们 将 假定 使 用 基于 卡片 的 方案 。 我 们 将 堆 区 
分 成 若干 被 称 为 “卡片 ”的 区 段 , 并 维护 一 个 位 映射 来 指明 哪个 卡片 是 脏 的 ( 即 其 中 有 一 个 或 多 个 
引用 被 覆 写 ) o 

3) 再 次 暂停 增 变 者 的 运行 , 重新 扫描 所 有 可 能 保存 了 指向 未 被 访问 对 象 的 引用 的 卡片 。 

对 于 一 个 大 型 多 线程 应 用 , 从 根 集 到 达 的 对 象 的 集合 可 能 非常 大 。 终 止 所 有 增 变 者 的 执行 ， 
然后 花费 很 多 时 间 和 空间 去 访问 所 有 这 样 的 对 象 是 不 可 行 的 。 同 时 ， 因 为 堆 的 规模 巨大 , 并 且 增 
变 线程 数量 巨大 , 在 将 所 有 对 象 扫描 一 次 之 后 , 很 多 卡片 都 需要 重新 扫描 。 此 时 , 值得 推荐 的 做 
法 是 并 行 地 扫描 其 中 的 某 些 卡片 , 同时 允许 增 变 者 继续 并 发 执行 。 

为 了 并 行 地 实现 上 面 第 (2) 步 中 的 跟踪 过 程 , 我 们 将 使 用 多 个 垃圾 回收 线程 。 这 些 线程 和 各 
个 增 变 者 线程 并 发 地 运行 , 以 跟踪 得 到 大 部 分 可 达 对 象 。 然 后 , 为 了 实现 第 (3 ) 步 , 我 们 暂停 执 
行 各 个 增 变 者 ,使 用 并 行 线程 来 保证 找到 所 有 的 可 达 对 象 。 

完成 第 (2) 步 中 跟踪 过 程 的 方法 是 让 每 个 增 变 者 线程 在 完成 其 自身 工作 的 同时 执行 部 分 垃圾 
回收 工作 。 另 外 , 我 们 也 使 用 一 些 专门 用 于 回收 垃圾 的 线程 。 一 旦 垃圾 回收 过 程 启动 ， 只 要 增 变 
者 线程 执行 了 某 个 内 存 分 配 操作 , 它 同 时 也 会 执行 一 些 跟踪 计算 。 只 有 当 计 算 机 中 有 空闲 的 时 
钟 周期 时 , 专用 的 垃圾 回收 线程 才 会 投入 使 用 。 和 增 量 式 分 析 一 样 ， 只 要 增 变 者 写 信 了 一 个 从 已 
扫描 对 象 指向 未 被 访问 对 象 的 引用 , 存放 这 个 引用 的 卡片 就 被 标记 为 脏 的 , 需要 重新 扫描 。 

下 面 给 出 一 个 并 行 、 并 发 垃圾 回收 算法 的 大 概 描 述 : 

1) 扫描 每 个 增 变 者 线程 的 根 集 , 将 所 有 可 以 从 根 集中 直接 到 达 的 对 象 设 为 待 扫 描 状 态 。 完 
成 这 一 步 的 最 简单 的 增 量 式 做 法 是 等 待 一 个 增 变 者 线程 调用 内 存 管理 器 ， 如果 那 时 它 的 根 集 还 
没有 被 扫描 , 就 让 它 扫 描 自己 的 根 集 。 如 果 所 有 其 他 跟踪 工作 都 已 经 完成 ,而 某 个 增 变 者 线程 还 
没有 调用 内 存 分 配 函 数 , 那么 必须 暂停 这 个 线程 , 扫描 它 的 根 集 。 

2) 扫描 处 于 待 担 描 状 态 的 对 象 。 为 了 支持 并 行 计算 , 我 们 使 用 一 个 由 固定 大 小 的 工作 包 
(work packet ) 组 成 的 工作 队列 。 每 个 工作 包 保存 了 一 些 待 扫描 对 象 。 当 发 现 待 担 描 对 象 时 , 它 
们 就 被 放置 到 工作 包 中 。 等 待 工作 的 线程 将 从 队列 中 取出 这 些 工 作 包 ,并 跟踪 其 中 的 待 要 描 对 
象 。 这 种 策略 允许 在 跟踪 过 程 中 把 工作 量 平均 分 配给 各 个 工作 线程 。 如 果 系 统 用 完了 存储 空间 ， 
使 得 我 们 无 法 找到 创建 这 些 工 作 包 所 需 的 空间 , 就 直接 为 保存 这 些 对 象 的 卡片 加 上 标记 , 使 它们 
将 在 以 后 被 扫描 。 后 一 种 处 理 方法 总 是 可 行 的 , 因为 存放 卡片 标记 的 位 数组 已 经 预先 分 配 好 了 。 

3) 扫描 脏 卡 片 中 的 对 象 。 当 工作 队列 中 不 再 有 待 扫 描 对 象 , 并 且 所 有 线程 的 根 集 都 已 经 被 
扫描 过 之 后 , 我 们 重新 扫描 这 些 卡 片 以 寻找 可 达 对 象 。 只 要 增 变 者 继续 执行 , 脏 卡 片 就 会 不 断 产 
生 。 因 此 ,我们 需要 依照 某 种 标准 来 停止 跟踪 过 程 。 比 如 只 人 允许 卡片 被 再 次 扫描 一 次 或 固定 的 
次 数 , 或 者 当 未 完成 扫描 的 卡片 数量 减少 到 某 个 净值 时 停止 跟踪 。 这 人 么 做 的 结果 是 使 得 并 行 和 
并 发 步骤 通常 会 在 完成 全 部 跟踪 工作 之 前 就 停止 。 剩 下 的 工作 将 在 下 面 介绍 的 最 后 一 步 中 完成 。 

4) 最 后 一 步 保证 所 有 的 可 达 对 象 都 被 标记 为 已 被 访问 的 。 随 着 所 有 增 变 者 停止 执行 , 使 用 
系统 中 的 所 有 处 理 器 就 可 以 快速 找到 所 有 线程 的 根 集 。 因 为 大 部 分 可 达 对 象 已 经 被 跟踪 确定 ， 
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预计 只 有 少量 的 对 象 会 被 放 在 待 扫描 状态 中 。 所 有 的 线程 都 参与 了 对 其 余 可 达 对 象 的 跟踪 和 对 
所 有 卡片 的 重新 扫描 。 

我 们 必须 控制 启动 跟踪 过 程 的 频率 ,这 很 重要 。 跟 踪 步 又 就 像 是 一 场 赛跑 。 增 变 者 创建 出 必 
须 被 扫描 的 新 对 象 和 新 引用 , 而 跟踪 过 程 则 试图 扫描 所 有 可 达 对 象 , 并 重新 扫描 同时 产生 的 脏 卡 
片 。 在 需要 进行 垃圾 回收 之 前 过 分 频繁 地 启动 跟踪 过 程 是 没有 必要 的 , 因为 这 样 做 将 会 增加 漂 
浮 垃圾 的 数量 。 男 一 方面 , 我 们 又 不 能 等 到 存储 耗 尽 时 才 开 始 跟踪 过 程 。 因 为 这 时 增 变 者 将 不 
能 继续 运行 ,此 时 的 情况 就 退化 为 使 用 全 面 停顿 式 回收 器 的 情形 。 因 此 , 算法 必须 适当 地 选择 启 
动 回 收 的 时 机 和 跟踪 的 频率 。 对 前 面 的 各 轮 垃圾 回收 中 的 对 象 增 变 速率 的 估算 可 以 帮助 我 们 在 
这 方面 做 出 决策 。 根 据 专用 垃圾 回收 线程 所 做 的 工作 量 , 可 以 动态 调整 跟踪 频率 。 
7.8.2 部 分 对 象 重新 定位 

就 像 从 7. 6.4 节 开 始 讨论 的 , 拷贝 或 压缩 回收 器 的 优势 在 于 消除 碎片 。 然而 , 这 些 回收 器 需 
要 不 小 的 开销 。 压 缩 回收 器 需要 在 垃圾 回收 结束 时 移动 所 有 的 对 象 并 更 新 所 有 的 引用 。 拷 贝 回 
收 器 在 跟踪 过 程 中 就 找 出 可 达 对 象 的 位 置 。 如 果 跟 踪 采 用 增 量 式 执行 方式 ,我 们 要 么 对 增 变 者 的 
每 个 引用 进行 转换 , 要 么 到 最 后 才 移 动 所 有 的 对 象 并 更 新 它们 的 引用 。 这 两 种 做 法 都 是 比较 昂 
贵 的 , 对 大 型 堆 区 来 说 尤其 如 此 。 

我 们 可 以 改 用 一 个 拷贝 世代 垃圾 回收 器 。 它 在 回收 年 轻 对 象 并 减少 碎片 方面 很 有 效 , 但 是 
在 回收 成 熟 对 象 时 比较 昂贵 。 我 们 可 以 使 用 列车 算法 来 限制 每 次 分 析 时 处 理 的 成 熟 数据 的 数量 。 
然而 , 列车 算法 的 代价 和 每 个 区 域 的 被 记忆 集 的 大 小 相关 。 

有 一 种 混合 型 的 回收 方案 , 它 使 用 并 发 跟踪 来 回收 所 有 不 可 达 对 象 , 同时 只 移动 部 分 对 象 。 
这 种 方法 减少 了 碎片 ,又 不 会 因为 在 每 个 回收 循环 中 进行 重新 定位 而 引起 额外 的 开销 。 

1) 在 跟踪 开始 之 前 , 选择 将 被 清空 的 一 部 分 堆 区 。 

2) 当 标 记 可 达 对 象 时 , 记 住 所 有 指向 指定 区 域内 的 对 象 的 引用 。 

3) 当 跟 踪 完 成 时 ,并 行 地 清扫 存储 空间 以 回收 被 不 可 达 对 象 占用 的 空间 。 

4) 最 后 , 清空 占据 指定 区 域 的 可 达 对 象 , 并 修正 指向 被 清空 对 象 的 引用 。 
7.8.3 ”类 型 不 安全 的 语言 的 保守 垃圾 回收 

如 7.5.1 节 中 讨论 的 , 我 们 不 可 能 构造 出 一 个 可 以 处 理 所 有 C 和 C ++ 程序 的 垃圾 回收 器 。 
因为 我 们 总 是 可 以 通过 算术 运算 来 计算 地 址 , 所 以 在 C 和 C++ 中 , 没有 任何 内 存 位 置 可 被 认为 
是 不 可 达 的 。 然 而 , 很 多 C 或 C++ 程 序 从 不 按照 这 种 方式 随意 地 构造 地 址 。 已 经 证 明 , 人们 可 
以 为 这 一 类 程序 构造 出 一 种 保守 的 垃圾 回收 器 (也 就 是 不 一 定 回收 所 有 垃圾 的 回收 器 ), 在 实践 
中 它 能 够 很 好 地 完成 任务 。 

保守 的 垃圾 回收 器 假定 我 们 不 可 以 随意 构造 出 一 个 地 址 , 或 者 在 没有 指向 某 已 分 配 存储 块 
中 某 处 的 地 址 的 情况 下 得 到 该 存储 块 的 地 址 。 我 们 可 以 在 程序 中 找 出 所 有 满足 这 一 假设 的 垃圾 。 
方法 是 , 对 于 在 任意 可 达 存 储 区 域 中 找到 的 一 个 三 进 制 位 模式 , 如 果 该 模式 可 以 被 构造 成 一 个 内 
存 位 置 , 我 们 就 认为 它 是 一 个 有 效 地址 。 这 种 方案 可 能 会 把 有 些 数据 错 当 作 地 址 。 然 而 , 这 么 做 
是 正确 的 , 因为 这 只 会 使 得 垃圾 回收 器 保守 地 回收 垃圾 , 留 下 的 数据 包含 了 所 有 必要 的 数据 。 

对 象 重 定位 需要 更 新 所 有 指向 旧地 址 的 引用 , 使 之 指向 新 地 址 ; 因此 它 和 保守 的 垃圾 回收 方 
法 是 不 兼容 的 。 因 为 保守 的 垃圾 回收 器 并 不 能 确认 某 个 位 模式 是 否 真 的 指向 某 个 实际 地 址 ,所 
以 它 不 能 修改 这 些 模 式 并 使 之 指向 新 的 地 址 。 

下 面 是 一 个 保守 的 垃圾 回收 器 的 工作 方式 。 首 先 修改 内 存 管理 器 , 使 之 为 所 有 已 分 配 内 存 
块 保存 一 个 数据 映射 (data map) 。 这 个 映射 使 我 们 很 容易 地 找到 一 个 内 存 块 的 起 止 位 置 。 这 两 


322 第 7 章 





个 起 止 位 置 跨越 了 多 个 地 址 。 跟 踪 过 程 开始 时 ,首先 扫描 程序 的 根 集 , 找 出 所 有 看 起 来 像 内 存 位 
置 的 位 模式 ,此 时 我 们 不 考虑 它 的 类 型 。 通 过 在 数据 映射 中 查找 这 些 可 能 的 地 址 ,我 们 可 以 找 出 
所 有 可 能 通过 这 些 位 模式 到 达 的 内 存 块 的 开始 位 置 , 并 将 它们 置 为 待 扫 描 状 态 。 然 后 , 我 们 扫描 
所 有 待 扫描 的 内 存 块 ， 找 出 更 多 (很 可 能 ) 可 达 的 内 存 块 ,并 且 将 它们 放 人 工作 列表 。 重 复 扫描 
过 程 , 直到 工作 列表 为 空 。 在 完成 跟踪 工作 之 后 , 我 们 使 用 上 述 数据 映射 来 清扫 整个 堆 区 , 定位 
并 释放 所 有 不 可 达 的 内 存 块 。 

7.8.4 弱 引 用 

有 时 候 , 虽然 程序 员 使 用 了 带 有 垃圾 回收 机 制 的 语言 , 但 是 仍然 希望 自己 管理 内 存 , 或 者 管 

理 部 分 内 存 。 也 就 是 说 , 尽管 仍然 存在 一 些 引用 指向 某 些 对 象 , 但 程序 员 知道 这 些 对 象 不 会 再 被 
访问 。 一 个 来 自 编译 的 例子 可 以 说 明 这 一 问题 。 
DRA 我们 已 经 看 到 , 词法 分 析 器 通常 会 管理 一 个 符号 表 , 为 它 磁 到 的 每 个 标识 符 创建 一 个 
对 象 。 比 如 , 这 些 对 象 可 能 作为 词法 值 被 附加 于 语法 分 析 树 中 代表 这 些 标识 符 的 叶子 结 点 上 。 
然而 ,以 这 些 标识 符 的 字符 串 作为 键 值 构 造 一 个 散 列 表 有 助 于 对 这 些 对 象 进 行 定 位 。 这 个 散 列 
表 可 以 在 词法 分 析 器 磁 到 一 个 标识 符 词法 单元 时 更 容易 找到 对 应 的 对 象 。 

当 编 译 器 扫描 完 标识 符 7 的 作用 域 时 , 1 的 符号 表 对 象 不 再 有 任何 来 自 语 法 分 析 树 的 引用 ， 
也 没有 来 自 可 能 被 编译 器 使 用 的 其 他 中 间 结 构 的 引用 。 然 而 , 在 散 列表 中 仍然 存在 一 个 指向 这 
个 对 象 的 引用 。 因为 散 列表 是 编译 器 的 根 集 的 一 部 分 , 所 以 这 个 对 象 不 能 作为 垃圾 被 回收 。 如 
果 碰 到 了 另 一 个 词素 和 7 相同 的 标识 符 ; 编译 器 就 会 发 现 7 已 经 过 时 了 ,指向 1 的 对 象 的 引用 将 
被 删除 。 然 而 ,如果 没有 遇 到 词素 相同 的 其 他 标识 符 , 那么 了 的 对 象 仍然 是 不 可 回收 的 , 尽管 在 
之 后 的 整个 编译 过 程 中 它 都 是 无 用 的 。 o 

如 果 例 子 7. 17 中 提出 的 问题 很 重要 , 那么 编译 器 的 作者 可 以 设法 在 标识 符 的 作用 域 一 结束 
时 就 在 散 列表 中 删除 对 相应 对 象 的 所 有 引用 。 然 而 ， 一 种 被 称 为 弱 引 用 ( weak reference) 的 技术 
支持 程序 员 依靠 自动 垃圾 回收 来 解决 问题 ,并 且 不 会 因为 那些 实际 不 再 使 用 的 可 达 对 象 而 给 堆 
区 存储 带 来 负担 。 在 这 样 的 系统 中 ,允许 将 某 些 引用 声明 为 “ 弱 ” 引 用 。 弱 引用 的 一 个 例子 是 我 
们 刚刚 讨论 的 散 列 表 中 的 所 有 引用 。 当 垃圾 回收 器 扫描 一 个 对 象 时 ， 它 不 会 沿 着 该 对 象 内 的 弱 
引用 前 进 ， 也 不 会 将 它们 指向 的 对 象 设置 为 可 达 的 。 当 然 , 如 果 另 有 一 个 不 弱 的 引用 指向 这 一 个 
WR, 这 个 对 象 可 能 仍然 是 可 达 的 。 

7.8.5 7.8 节 的 练习 

! 练习 7. 8. 1: 在 7.8.3 节 中 ,我们 说 如 果 一 个 C 语 言 程序 只 会 在 已 存在 某 个 指向 某 存 储 块 
中 某 个 位 置 的 地 址 时 构造 出 指向 这 块 内 存 中 某 个 位 置 的 地 址 ,我 们 就 可 以 对 这 个 程序 进行 垃圾 
回收 。 因 此 我 们 将 形 如 


p = 12345; 
x =-¥p; 


的 代码 排除 在 外 , 因为 即使 没有 指针 指向 某 个 存储 块 , p 仍然 可 能 碰巧 指向 该 存储 块 。 另 一 方 
面 , 对 于 上 面 的 代码 , 更 可 能 发 生 的 情况 是 什么 地 方 都 不 指 , 执行 那个 代码 会 引起 一 个 内 存 分 
段 错误 。 然 而 , FAC 语言 可 能 写 出 一 段 代码 , 使 得 一 个 像 p 这 样 的 变量 一 定 指向 某 个 存储 块 , 且 
没有 其 他 指针 同时 指向 该 存储 块 。 写 出 一 个 这 样 的 程序 。 
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o 运行 时 刻 组 织 。 为 了 实现 源 语言 中 的 抽象 概念 , 编译 器 与 操作 系统 及 目标 机 器 协同 ， 创 
建 并 管理 了 一 个 运行 时 刻 环境 。 该 运行 时 刻 环境 有 一 个 静态 数据 区 ,用 于 存放 对 象 代码 
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和 在 编译 时 刻 创建 的 静态 数据 对 象 。 同 时 它 还 有 动态 的 栈 区 和 堆 区 ， 用 来 管理 在 目标 代 
码 执行 时 创建 和 销毁 的 对 象 ， 

控制 栈 。 过 程 调用 和 返回 通常 由 称 为 控制 栈 的 运行 时 刻 栈 管理 。 我 们 可 以 使 用 栈 结构 的 
原因 是 过 程 调用 (或 者 说 活动 ) 在 时 间 上 是 嵌 套 的 。 也 就 是 说 , 如 果 p 调用 g, 那么 4 的 活 
动 就 说 套 在 p 的 活动 之 内 。 

栈 分 配 。 对 于 那些 允许 或 要 求 局 部 变量 在 它们 的 过 程 结束 之 后 就 不 可 访问 的 语言 而 言 ， 
局 部 变量 的 存储 空间 可 以 在 运行 时 刻 栈 中 分 配 。 对 于 这 样 的 语言 , 每 一 个 活跃 的 活动 都 
在 控制 栈 中 有 -个 活动 记录 (或 者 说 帧 ) 。 活 动 树 的 根 结 点 位 于 栈 底 ， 而 栈 中 的 全 部 活动 
记录 对 应 于 活动 树 中 到 达 当 前 控制 所 在 活动 的 路 径 。 当前 活动 的 记录 位 于 栈 顶 。 

访问 栈 中 的 非 局 部 数据 。 像 C 这 样 的 语言 不 支持 典 套 的 过 程 声明 , 因此 一 个 变量 的 位 置 
要 妇 是 全 局 的 ,要 女 可 以 在 运行 时 刻 栈 顶 的 活动 记录 中 找到 。 对 于 带 有 嵌 套 过 程 的 语言 
而 言 , 我 们 可 以 通过 访问 链 来 访问 栈 中 的 非 局 部 数据 。 访 问 链 是 加 在 各 个 活动 记录 中 的 
指针 。 可 以 顺 着 访问 链 组 成 的 链 路 到 达 正确 的 活动 记录 ,从 而 找到 期 待 的 非 局 部 数据 。 
显示 表 是 一 个 和 访问 链 联 合 使 用 的 辅助 数组 , 它 提供 了 一 个 不 需要 使 用 访问 链 链 路 的 高 
效 捷径 。 

堆 管 理 。 堆 是 用 来 存放 生命 周期 不 确定 的 , 或 者 可 以 生存 到 被 明确 删除 时 刻 的 数据 的 存 
储 区 域 。 存 储 管理 器 分 配 和 回收 堆 区 中 的 空间 。 垃圾 回收 在 堆 区 中 找 出 不 再 被 使 用 的 空 
间 , 这 些 空间 可 以 回收 并 用 于 存放 其 他 数据 项 。 对 于 要 求 垃圾 回收 的 语言 , 垃圾 回收 器 
是 存储 管理 器 的 一 个 重要 子 系统 。 

利用 局 部 性 。 通 过 更 好 地 利用 存储 的 层次 结构 ,存储 管理 器 可 以 影响 程序 的 运行 时 间 。 
访问 存储 的 不 同 区 域 所 花 的 时 间 可 能 从 几 纳 秒 到 几 毫秒 不 等 。 幸 运 的 是 , 大 部 分 程序 将 
它们 的 大 部 分 时 间 用 于 执行 相对 较 小 的 一 部 分 代码 , 并 且 此 时 只 会 访问 一 小 部 分 数据 。 
如 果 一 个 程序 很 可 能 在 短期 内 再 次 访问 刚刚 访问 过 的 存储 位 置 ,该 程序 就 具有 时 间 局 部 
性 。 如 果 一 个 程序 很 可 能 访问 刚刚 访问 的 存储 区 域 附近 的 位 置 ， 该 程序 就 具有 空间 局 
部 性 。 

减少 碎片 。 随 着 程序 分 配 和 回收 存储 , 堆 区 可 能 会 变 得 破碎 ,或 者 说 被 分 割 成 大 量 细小 
且 不 连续 的 空闲 空间 (或 称 为 “窗口 ”) o best-fit 策略 (分 配 能 够 满足 空间 请 求 的 最 小 可 用 
“窗口 ”) 经 实践 证 明 是 有 效 的 。 尽 管 best-fit 策略 提高 了 空间 利用 率 , 但 对 于 空间 局 部 性 
而 言 它 可 能 并 不 是 最 好 的 。 可 以 通过 合并 或 者 说 接合 相 邻 的 “窗口 ”来 减少 碎片 。 

人 工 回 收 。 人 工 存 储 管理 有 两 个 常见 的 问题 : 没有 删除 那些 不 可 能 再 被 引用 的 数据 ,这 
称 为 内 存 泄漏 错误 ; 引用 已 经 被 删除 的 数据 ,这 称 为 悬空 指针 引用 错误 。 

可 达 性 。 垃 圾 就 是 不 能 被 引用 或 者 说 到 达 的 数据 , 有 两 种 寻找 不 可 达 对 象 的 基本 方法 ; 
要 么 截获 一 个 对 象 从 可 达 变 成 不 可 达 的 转换 ， 要 么 周期 性 地 定位 所 有 可 达 对 象 , 并 推导 
出 其 余 对象 都 是 不 可 达 的 。 

引用 计数 回收 器 维护 了 指向 一 个 对 象 的 引用 的 计数 。 当 这 个 计数 变 为 0 时 ,该 对 象 就 变 
成 不 可 达 的 。 这 样 的 回收 器 带 来 了 维护 引用 的 开销 , 并 且 可 能 无 法 找 出 “循环 "的 垃圾 ， 
即 由 相互 引用 的 不 可 达 对 象 组 成 的 垃圾 。 这 些 垃圾 也 可 能 通过 由 引用 组 成 的 链 路 相互 
引用 。 

基于 跟踪 的 垃圾 回收 器 从 根 集 出 发 ， 和 迭代 地 检查 或 跟踪 所 有 的 引用 , 找 出 所 有 可 达 对 象 。 
根 集 包 括 了 所 有 不 需要 对 任何 指针 解 引用 就 可 直接 访问 的 对 象 。 

标记 - 清扫 式 回收 器 在 一 开始 的 跟踪 阶段 访问 并 标记 所 有 可 达 对 象 , 然后 清扫 堆 区 , E 


324 第 7 章 





收 不 可 达 对 象 。 

o 标记 并 压缩 回收 器 改进 了 标记 并 清扫 算法 。 它 们 把 堆 区 中 的 可 达 对 象 重新 定位 ， 从 而 消 
除 存储 碎片 。 

o 将 贝 回收 器 将 跟踪 过 程 和 发 现 空闲 空间 过 程 之 间 的 依赖 关系 打破 。 它 将 存储 分 为 两 个 半 
空间 4 和 B。 首 先 使 用 菜 个 半空 间 ， 比 如 说 4, 来 满足 分 配 请 求 , 直到 它 被 填 满 。 此 时 垃 
圾 回收 器 开始 工作 , 将 可 达 对 象 拷贝 到 另 一 个 半空 间 , 也 就 是 B, 然后 对 换 两 个 半空 间 的 
角色 。 

。 增 量 式 回收 器 。 简 单 的 基于 跟踪 的 回收 器 在 垃圾 回收 期 间 会 停止 用 户 程序 的 执行 。 增 量 

式 回收 器 证 垃圾 回收 过 程 和 用 户 程序 (或 者 说 增 变 者 ) 交错 运行 。 增 变 者 可 能 干扰 增 量 式 

可 达 性 分 析 , 因为 它 可 能 改变 之 前 已 扫描 对 象 中 的 引用 。 因 此 , 增 量 式 回收 器 通过 超 量 

估计 可 达 对 象 集合 ,达到 安全 工作 的 目标 。 所 有 的 “漂浮 垃圾 ”可 以 在 下 一 轮回 收 中 被 

删除 。 | 

部 分 回收 器 同样 可 以 减少 停顿 时 间 。 它 们 每 次 只 回收 一 部 分 垃圾 。 最 有 名 的 部 分 回收 算 

法 是 世代 垃圾 回收 方法 , 它 根据 对 象 已 分 配 时 间 的 长 短 对 对 象 分 区 , 对 新 建 对 象 进行 更 

频繁 的 回收 操作 ,因为 它们 的 生命 期 通常 较 短 。 另 一 个 算法 列车 算法 使 用 固定 长 度 的 被 

称 为 车 厢 的 区 域 。 这 些 车 厢 被 组 织 成 列车 。 每 一 个 回收 步骤 都 处 理 尚 存 的 第 一 辆 列车 中 

的 当前 的 第 一 节 车 叮 。 当 近 节 车 啉 被 回收 时 ,， 可 达 对 象 被 移动 到 其 他 车 厢 中 ， 这 节 车 厢 

中 最 终 只 剩 下 垃圾 , 因此 可 以 将 其 从 该 列车 中 删除 。 这 两 种 算法 可 以 一 起 使 用 , 创建 出 

一 个 部 分 回收 器 。 该 回收 器 对 较 年 轻 对象 使 用 世代 算法 ， 对 较 成 熟 的 对 象 使 用 列车 算法 。 
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第 8 章 代码 生成 


我 们 的 编译 器 模型 的 最 后 一 个 步 又 是 代码 生成 器 。 如 图 8-1 所 示 , 它 以 编译 器 前 端 生成 的 中 
间 表 示 (IR) 和 相关 的 符号 表 信息 作为 输入 , 输出 语义 等 价 的 目标 程序 。 


图 8-1 代码 生成 器 的 位 置 


对 代码 生成 器 的 要 求 是 很 严格 的 y 目标 程序 必须 保持 源 程序 的 语义 含义 ， 还 必须 具有 很 高 
的 质量 。 也 就 是 说 , 它 必须 有 效 地 利用 目标 机 器 上 的 可 用 资源 。 此 外 ， 代码 生成 器 本 身 必须 能 够 
高 效 运行 。 

具有 挑战 性 的 是 , 从 数学 上 讲 , 为 给 定 源 程序 生成 一 个 最 优 的 目标 程序 是 不 可 判定 问题 , 在 代 
码 生成 中 碰 到 的 很 多 子 问题 ( 比如 寄存 器 分 配 ) 都 具有 难以 处 理 的 计算 复杂 性 。 在 实践 中 ， 我 们 必须 
使 用 那些 能 够 产生 良好 但 不 一 定 最 优 的 代码 的 启发 性 技术 。 幸 运 的 是 ， 启发 性 技术 已 经 非常 成 熟 ， 
一 个 精心 设计 的 代码 生成 器 所 产生 的 代码 要 比 那些 由 简单 的 生成 器 生成 的 代码 快 好 儿 倍 。 

要 产生 高 效 目标 程序 的 编译 器 都 会 在 代码 生成 之 前 包含 一 个 优化 步骤。 优化 器 把 一 个 IR 映 
射 为 男 一 个 可 用 于 产生 高 效 代码 的 芋 。 编译 器 的 代码 优化 和 代码 生成 步骤 通常 被 称 为 编译 器 的 
后 端 (back end) 。 它 们 可 能 在 生成 目标 程序 之 前 对 IR 作 多 趟 处 理 。 代 码 优化 将 在 第 9 章 中 详细 
讨论 。 不 论 代码 生成 之 前 有 没有 优化 步骤 ,都 可 以 使 用 本 章 所 讨论 的 技术 。 

代码 生成 器 有 三 个 主要 任务 : 指令 选择 、 寄 存 器 分 配 和 指派 、 以 及 指令 排序 。 这 些 任 务 的 重 
要 性 将 在 8. 1 节 中 概述 。 指 令 选择 考虑 的 问题 是 选择 适当 的 目标 机 指令 来 实现 阴 语句 。 寄 存 器 
分 配 和 指派 考虑 的 问题 是 把 哪个 值 放 在 哪个 寄存 器 中 。 指令 排序 考虑 的 问题 是 按照 什么 顺序 来 
安排 指令 的 执行 。 

本 意 给 出 了 一 些 和 代码 生成 相关 的 算法 , 代码 生成 器 可 以 使 用 这 些 算法 把 输入 的 IR 翻译 成 
简单 寄存 器 机 器 的 目标 语言 指令 序列 。 这 些 算法 将 使 用 8. 2 节 中 的 机 器 模型 来 解释 。 第 10 章 讨 
论 了 复杂 的 现代 机 器 的 代码 生成 问题 , 这 些 现 代 机 器 支持 在 单一 指令 中 的 大 量 并 行 性 。 

在 讨论 了 代码 生成 器 设计 中 的 众多 难题 之 后 , 我 们 给 出 了 一 个 编译 器 需要 生成 什么 样 的 目 
标 代码 , 以 支持 常见 源 语言 中 所 包含 的 抽象 机 制 。 在 8. 3 节 , 我 们 概述 了 静态 和 栈 式 数据 区 分 配 
的 实现 方法 , 并 说 明 如 何 把 IR 中 的 名 字 转 换 成 为 目标 代码 中 的 地 址 。 

很 多 代码 生成 器 把 IR 指令 分 成 “基本 块 ”, 每 个 基本 块 由 一 组 总 是 一 起 执行 的 指令 组 成 。 把 
IR 划分 成 基本 块 是 8.4 节 的 主题 。 接 下 来 介绍 了 针对 基本 块 的 一 些 简单 的 局 部 转换 方法 。 从 转 
换 得 到 的 基本 块 出 发 可 以 生成 更 加 高 效 的 代码 。 虽 然 要 到 第 9 章 才 开始 考虑 更 加 深入 的 代码 优 
化 理论 , 但 这 种 转换 已 经 是 代码 优化 的 初步 形式 。 一 个 有 用 的 局 部 转换 的 例子 是 在 中 间 代码 的 
层次 上 寻找 公共 子 表达 式 , 然后 相应 地 把 算术 运算 替换 为 更 简单 的 拷贝 运算 。 

8. 6 节 给 出 了 一 个 简单 的 代码 生成 算法 。 它 依次 为 每 个 语句 生成 代码 , 并 把 运算 分 量 尽 可 能 
长 时 间 地 保留 在 寄存 器 中 。 这 种 代码 生成 器 的 输出 可 以 很 容易 地 使 用 窥 孔 优化 技术 进行 优化 。 
接 下 来 的 8.7 节 中 将 讨论 妾 孔 优化 技术 。 

其 余 的 部 分 将 研究 指令 选择 和 寄存 器 分 配 。 
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8.1 代码 生成 器 设计 中 的 问题 


虽然 代码 生成 器 设计 依赖 于 中 间 表 示 形 式 、 目 标语 言 运行 时 刻 系统 的 特定 细节 , 但 指令 选 
择 、 寄 存 器 分 配 和 指派 以 及 指令 排序 等 任务 会 在 几乎 所 有 的 代码 生成 器 设计 中 碰 到 。 

代码 生成 器 的 最 重要 的 标准 是 生成 正确 的 代码 。 正 确 性 问题 非常 突出 的 原因 是 代码 生成 器 
会 碰 到 很 多 种 特殊 情况 。 在 优先 考虑 正确 性 的 情况 下 , 另 一 个 重要 的 设计 目标 是 把 代码 生成 带 
设计 得 易于 实现 、 测试 和 维护 。 

8.1.1 代码 生成 器 的 输入 

代码 生成 器 的 输入 是 由 前 端 生 成 的 源 程序 的 中 间 表 示 形 式 以 及 符号 表 中 的 信息 组 成 的 。 这 
些 信息 用 来 确定 IR 中 的 名 字 所 指 的 数据 对 象 的 运行 时 刻 地 址 。 

Ry ha RIERA RS, 包括 诸如 四 元 式 、 三 元 式 、 间 接 三 元 式 等 三 地 址 表示 方 
式 ; 也 包括 诸如 字 节 代码 和 堆栈 机 代码 的 虚拟 机 表示 方式 ; 包括 诸如 后 缀 表示 的 线性 表示 方式 ; 
还 包括 诸如 语法 树 和 DAG 的 图 形 表示 方式 。 本 章 中 的 多 个 算法 都 是 根据 第 6 章 中 所 考虑 的 表示 
方法 来 表示 的 。 这 些 表 示 方 法 包括 : 三 地 址 代码 、 树 和 DAG。 然 而 , 我 们 讨论 的 技术 也 可 以 用 于 
其 他 的 中 间 表 示 形 式 。 

在 本 音 中 , 我 们 假设 前 端 已 经 扫描 、 分 析 了 源 程序 , 并 把 它 转 换 成 为 相对 低层 次 的 中 间 表 示 
形式 , 因此 在 IR 中 出 现 的 名 字 的 值 可 以 用 能 被 目标 机 直接 处 理 的 量 来 表示 。 这 些 量 可 以 是 整数 、 
浮 点 数 等 。 我 们 还 假设 所 有 的 语法 和 静态 语义 错误 都 已 经 被 检测 出 来 ， 必 要 的 类 型 检查 都 已 经 
完成 , 而 类 型 转换 运算 已 经 被 插入 到 必要 的 地 方 。 因 此 ,代码 生成 器 可 以 在 工作 过 程 中 假设 它 的 
输入 已 经 排除 了 这 些 错误 。 

8.1.2 目标 程序 

构造 一 个 能 够 产生 高 质量 机 器 代码 的 代码 生成 器 的 难度 会 受到 目标 机 器 的 指令 集体 系 结构 
的 极 天 影响 。 最 常见 的 目标 机 体系 结构 是 RISC( 精简 指令 集 计算 机 ) 、CISC( 复杂 指令 集 计算 机 ) 
和 基于 堆栈 的 结构 。 

RISC 机 通常 有 很 多 寄存 器 、 三 地 址 指令 、 简单 的 寻 址 方式 和 一 个 相对 简单 的 指令 集体 系 结 
W E, CISC 机 通常 具有 较 少 寄存 器 、 两 地 址 指令 、 多 种 寻 址 方式 、 多 种 类 型 的 寄存 器 、 可 变 
长 度 的 指令 和 具有 副作用 的 指令 。 

在 基于 栈 的 机 器 中 ,运算 是 通过 把 运算 分 量 压 人 一 个 栈 , 然后 再 对 栈 顶 的 运算 分 量 进行 运算 
而 完成 的 。 为 了 获得 高 性 能 , 栈 顶 元 素 通常 保存 在 寄存 器 中 。 因 为 人 们 党 得 堆栈 组 织 的 限制 太 
Z, 并 且 需 要 太 多 的 交换 和 拷贝 操作 , 所 以 基于 堆栈 的 机 器 几乎 已 经 消失 了 。 

但 是 , 基于 堆栈 的 体系 结构 随 着 Java 虚拟 机 (JVM) 的 出 现 又 复活 了 。JVM 是 一 个 Java 字 节 
码 的 软件 解释 器 。 字 节 码 是 由 Java 编译 器 生成 的 一 种 中 间 语 言 。 这 个 解释 器 提供 了 跨 平 台 的 软 
件 兼 容 性 。 这 是 Java 成 功 的 一 个 重要 因素 。 

解释 执行 会 引起 很 高 的 性 能 损失 , 有 时 可 能 达到 10 倍 的 数量 级 。 为 了 克服 这 个 问题 ,大 们 
创造 了 即时 (Just-In-Time, JIT) Java 编译 器 。 这 些 即时 编译 器 在 运行 时 刻 把 字 节 码 翻译 成 目标 机 
上 的 本 地 硬件 指令 集 。 另 一 个 提高 Java 程序 性 能 的 方法 是 建立 一 个 编译 器 ,把 Java 程序 直接 编 
译 成 目标 机 器 指令 , 彻底 绕 过 字 节 码 。 

输出 一 个 使 用 绝对 地 址 的 机 器 语言 程序 的 优点 是 程序 可 以 放 在 内 存 中 的 某 个 固定 位 置 上 ， 
并 立即 执行 。 程 序 可 以 很 快 地 进行 编译 和 执行 。 

输出 可 重 定位 的 机 器 语言 程序 (通常 称 为 目标 模块 ，object module) 可 以 使 各 个 子 程序 能 够 被 
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分 别 编译 。 一 组 可 重 定位 的 目标 模块 可 以 被 一 个 链接 加 载 器 链接 到 一 起 并 加 载运 行 。 如 果 我 们 
要 生成 可 重 定位 的 目标 模块 ,我们 就 必须 为 链接 和 加 载 付出 代价 。 但 是 这 样 做 可 以 使 我 们 得 到 
很 多 的 灵活 性 。 我 们 可 以 把 子 程序 分 开 编译 , 并 能 够 从 一 个 目标 模块 中 调用 其 他 已 经 编译 好 的 
程序 。 如 果 目 标 机 没有 自动 处 理 重 定位 ,编译 器 就 必须 向 加 载 器 提供 明确 的 重 定位 信息 , 以便 把 
分 开 编 译 的 程序 模块 链接 起 来 。 

输出 一 个 汇编 程序 使 代码 生成 过 程 变 得 稍微 容易 一 些 。 我 们 可 以 生成 符号 指令 , 并 使 用 汇 
编 器 的 宏 机 制 来 帮助 生成 代码 。 这 么 做 的 代价 是 代码 生成 之 后 还 需要 增加 一 个 汇编 步骤 。 

在 本 章 中 , 我 们 将 使 用 一 个 非常 简单 的 类 RISC 计算 机 作为 目标 机 。 我 们 在 这 个 机 器 上 加 入 
了 一 些 类 CISC 的 寻 址 方式 。 这 样 我 们 就 可 以 讨论 CISC 机 器 的 代码 生成 技术 了 。 为 了 增加 可 读 
性 , 我 们 把 汇编 代码 用 作 目标 语言 。 只 要 变量 地 址 可 以 通过 偏 移 量 和 存放 于 符号 表 中 的 其 他 信 
息 计算 出 来 , 代码 生成 器 就 可 以 为 源 程序 中 的 名 字 生 成 可 重 定位 地 址 或 绝对 地 址 。 这 和 生成 符 
号 地 址 一 样 ,都 是 很 简单 的 事情 。 

8.1.3 指令 选择 

代码 生成 器 必须 把 IR 程序 映射 成 为 可 以 在 目标 机 上 运行 的 代码 序列 。 完 成 这 个 映射 的 复杂 
性 由 如 下 的 因素 决定 : 

。 IR 的 层次 。 

。 指令 集体 系 结构 本 身 的 特性 。 

。 想 要 达到 的 生成 代码 的 质量 。 

如 果 IR 是 高 层次 的 , 代码 生成 器 就 要 使 用 代码 模板 把 每 个 I 语句 翻译 成 为 机 器 指令 序列 。 
但 是 , 这 种 逐个 语句 生成 代码 的 方式 通常 会 产生 质量 不 佳 的 代码 。 这 些 代码 需要 进一步 优化 。 
如 果 IR 中 反映 了 相关 计算 机 的 某 些 低层 次 细节 , 那么 代码 生成 器 就 可 以 使 用 这 些 信息 来 生成 更 
加 高 效 的 代码 序列 。 

目标 机 指令 集 本 身 的 特性 对 指令 选择 的 难度 有 很 大 的 影响 。 比 如 , 指令 集 的 统一 性 和 完整 
性 是 两 个 很 重要 的 因素 。 如 果 目 标 机 没有 以 统一 的 方式 支持 每 种 数据 类 型 , 那么 总 体 规 则 的 每 
个 例外 都 需要 进行 特别 处 理 。 比 如 , 在 某 些 机 器 上 , 浮 点 数 运算 使 用 单独 的 寄存 器 完成 。 

指令 速度 和 机 器 的 特有 用 法 是 另外 一 些 重要 因素 。 如 果 我 们 不 考虑 目标 程序 的 效率 , 那么 
指令 选择 是 很 简单 的 。 对 于 每 一 种 三 地 址 语句 , 我 们 可 以 生成 一 个 代码 骨架 。 此 骨架 定义 了 对 
这 个 构造 生成 什么 样 的 目标 代码 。 比 如 , 每 一 个 形 如 x =y +z 的 三 地 址 语句 (其 中 x、y A z af 
是 静态 分 配 的 ) 可 以 被 翻译 成 如 下 的 代码 序列 : 


LD RO; Y H RO =y (把 y 装载 到 寄存 器 RO) 
ADD RO, RO,z // RO=ROHz (把 z 加 到 R0) 
ST x, RO // x= RO (把 RO 保存 到 x) 


这 种 策略 常常 会 产生 宛 余 的 加 载 和 存储 运算 。 比 如 , 下 面 的 三 地 址 语句 序列 


会 被 翻译 成 
LD RO, b // RO =b 
ADD RO, RO, c // RO = RO +c 
ST a, RO // a = RO 
LD RO, a // RO =a 
ADD RO, RO, e // RO = RO +e 
ST ds RO // d = RO 


这 里 的 第 四 个 语句 是 元 余 的 ,因为 它 加 载 了 一 个 刚刚 保存 到 内 存 的 值 。 并 且 如 果 a 以 后 不 再 被 
使 用 , 那么 第 三 个 语句 也 是 完 余 的 。 
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生成 代码 的 质量 通常 是 由 它 的 运行 速度 和 大 小 来 确定 的 。 在 大 多 数 机 器 上 , 一 个 给 定 的 IR 程 
序 可 以 用 很 多 种 不 同 的 代码 序列 来 实现 。 这 些 不 同 实现 之 间 在 代价 上 有 着 显著 的 差别 。 因 此 , 对 中 
间 代 码 的 简单 翻译 虽然 能 产生 正确 的 目标 代码 , 但 是 这 些 代码 却 可 能 过 于 低 效 而 让 人 不 可 接受 。 

比如 , 如 果 目 标 机 有 一 个 “加 一 ”指令 (INC), 那么 三 地 址 语句 a =a +1 可 以 用 一 个 指令 
INC a 来 实现 。 这 个 指令 要 比如 下 的 代码 序列 更 加 高 效 : 把 去 加 载 进 一 个 寄存 器 ,对 寄存 器 加 1， 
然后 把 结果 保存 回 a。 


LD RO, a // RO = a 
ADD RO, RO, #1 // RO = RO+1 
Si a,- RO // a= RO 


要 设计 出 良好 的 代码 序列 , 我 们 就 必须 知道 指令 的 代价 。 遗 憾 的 是 ,我 们 经 常 难以 得 到 精确 
的 代价 信息 。 对 于 一 个 给 定 的 三 地 址 构造 , 可 能 还 需要 有 关 该 构造 所 在 上 下 文 的 信息 才能 决定 
哪个 是 最 好 的 机 器 代码 序列 。 

在 8. 9 节 , 我 们 将 看 到 指令 选择 可 以 用 树 模式 匹配 过 程 来 建 模 。 在 这 个 过 程 中 , 我 们 把 IR 
和 机 器 指令 表示 为 树 结构 。 然 后 , 我 们 尝试 着 用 一 组 对 应 于 机 器 指令 的 子 树 覆 盖 一 棵 朴树 。 如 
果 我 们 把 每 棵 机 器 指令 子 树 和 一 个 代价 值 相关 联 , 我 们 就 可 以 用 动态 规划 的 方法 来 生成 最 优化 
的 代码 序列 。 动 态 规 划 将 在 8. 11 节 中 讨论 。 
8.1.4 寄存 器 分 配 

代码 生成 的 关键 问题 之 一 是 决定 哪个 值 放 在 哪个 寄存 器 里 面 。 寄 存 器 是 目标 机 上 运行 速度 
最 快 的 计算 单元 , 但 是 我 们 通常 没有 足够 的 寄存 器 来 存放 所 有 的 值 。 没 有 存放 在 寄存 器 中 的 什 
必须 存放 在 内 存 中 。 使 用 寄存 器 运算 分 量 的 指令 总 是 要 比 那些 运算 分 量 在 内 存 中 的 指令 短 并 且 
快 。 因 此 ,有效 利 用 寄存 器 非常 重要 。 

寄存 器 的 使 用 经 常 被 分 解 为 两 个 子 问题 ; 

1) 寄存 器 分 配 : 对 于 源 程序 中 的 每 个 点 ,我 们 选择 一 组 将 被 存放 在 寄存 器 中 的 变量 。 

2) FARR: 我 们 指定 一 个 变量 被 存放 在 哪个 寄存 器 中 。 

即使 对 于 单 寄 存 器 机 器 , 找到 一 个 从 寄存 器 到 变量 的 最 优 指派 也 是 很 困难 的 。 从 数学 上 讲 ， 
这 个 问题 是 NP 完全 的 。 而 且 , 目标 机 的 硬件 和 /或 操作 系统 可 能 要 求 代码 遵守 特定 的 寄存 器 使 
用 规则 ,从 而 使 这 个 问题 变 得 更 加 复杂 。 
DERI 有 些 机 器 要 求 为 某 些 运算 分 量 和 结果 使 用 寄存 器 对 ( 即 一 个 偶数 号 寄存 器 和 相 邻 的 奇数 
号 寄存 器 ) 。 比 如 , 在 某 些 机 器 上 , 整数 乘法 和 整数 除法 就 涉 
及 寄存 器 对 。 乘 法 指令 的 形式 如 下 : 


Mx, y 
其 中 被 乘 数 x 是 偶数 ARCATA BEM OP EE T 
乘 数 y 则 可 以 存放 在 任意 位 置 。 乘 法 结果 占据 了 整个 偶数 / a 
图 8-2， 两 个 三 地 址 代码 序列 
奇数 寄存 器 对 。 除 法 指令 的 形式 如 下 ， EREA 


Dx, y 
其 中 , 被 除数 占据 了 整个 偶数 /奇数 寄存 器 对 , x 是 其 中 的 偶 
数 号 寄存 器 ; 而 除数 是 y。 相 除 之 后 ,偶数 号 寄存 器 保存 余 
数 ,而 奇数 号 寄存 器 保存 商 。 

SUE, 考虑 图 8-2 中 的 两 个 三 地 址 代码 序列 。 图 8.2a 和 
图 8-2b 之 间 的 唯一 差别 是 第 三 个 语句 的 运算 符 。 图 8:2a 和 
图 8-2b 对 应 的 最 短 汇编 代码 序列 如 图 8-3 所 示 。 图 83 最 优 机 器 代码 序列 
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Ri 表示 第 i 号 寄存 器 。SRDA 表示 双 算 术 右 移 (Shift-Right-Double-Arithmetic), 而 SRDA RO 32 
把 被 除数 从 RO 中 移入 RL 并 把 RO 清空 ， 使 得 所 有 位 都 等 于 被 除数 的 正 负 号 位 。L, ST 和 入 分 别 
表示 加 载 , 保存 和 相 加 。 需 要 注意 的 是 , 把 a 加 载 到 哪个 寄存 器 的 最 优选 择 依赖 于 最 终 会 对 t 做 
什么 样 的 运算 。 El 

寄存 器 的 分 配 和 指派 的 策略 将 在 8. 8 节 讨 论 。8. 10 节 将 给 出 对 某 些 类 型 的 机 器 , 我 们 可 以 
构造 出 使 用 最 少 的 寄存 器 来 完成 表达 式 求 值 的 代码 序列 。 

8.1.5 求 值 顺序 

计算 执行 的 顺序 会 影响 目标 代码 的 效率 。 我 们 即将 看 到 ， 相 比 其 他 的 计算 顺序 而 言 , 某 些 计 
算 顺 序 对 用 于 存放 中 间 结 果 的 寄存 器 的 需求 更 少 。 但 是 在 一 般 情 况 下 ， 找到 最 好 的 顺序 是 一 个 
困难 的 NP 完全 问题 。 一 开始 ， 我 们 将 按照 中 间 代 码 生成 器 生成 代码 的 顺序 为 三 地 址 语句 生成 代 
码 , 从 而 暂时 避 开 这 个 问题 。 在 第 10 章 ， 我 们 将 研究 对 流水 线 计 算 机 的 代码 排序 。 这 种 流水 线 
计算 机 可 以 在 一 个 时 钟 周期 内 执行 多 个 运算 。 


8.2 目标 语言 


熟悉 目标 计算 机 及 其 指令 集 是 设计 一 个 优秀 代码 生成 器 的 前 提 。 为 了 给 某 个 目标 机 器 上 的 
一 个 完整 的 源 语言 生成 高 质量 的 代码 , 我 们 需要 了 解 该 目标 机 的 许多 细节 。 遗 憾 的 是 , 在 对 代码 
生成 的 一 般 性 讨论 中 不 可 能 描述 出 全 部 的 细节 。 在 本 章 中 ， 我 们 将 使 用 一 个 简单 计算 机 的 汇编 
代码 作为 目标 语言 。 这 个 计算 机 是 很 多 寄存 器 机 器 的 代表 。 然 而 ,本章 中 描述 的 很 多 代码 生成 
技术 也 可 以 用 于 很 多 其 他 类 型 的 机 器 。 
8.2.1 一 个 简单 的 目标 机 模型 

我 们 的 目标 计算 机 是 一 个 三 地 址 机 器 的 模型 。 它 具有 加 载 和 保存 操作 、 计 算 操作 、 跳 转 操作 
和 条 件 跳 转 。 这 个 计算 机 的 内 存 按照 字 节 寻 址 , CRA n NAAA RO, R1,…, Rn-1, 一 
个 完整 的 汇编 语言 具有 几 十 到 上 百 个 指令 。 为 了 避免 因为 过 多 的 细节 而 妨碍 对 概念 的 解释 , 我 
们 将 只 使 用 一 个 很 有 限 的 指令 集合 , 并 假设 所 有 的 运算 分 量 都 是 整数 。 大 部 分 指令 包含 一 个 运 
算 符 , 然后 是 一 个 目标 地 址 , 最 后 是 一 个 源 运算 分 量 的 列表 。 指 令 之 前 可 能 有 一 个 标号 。 我 们 假 
设 有 如 下 种 类 的 指令 可 用 : 
加 载运 算 : 指令 LD dst, addr 把 位 置 addr 上 的 值 加 载 到 位 置 dst。 这 个 指令 表示 赋值 dst = 
addr。 这 个 指令 最 常见 的 形式 是 LDr, x。 它 把 位 置 * 中 的 值 加 载 到 寄存 器 7 中 。 形 如 LD 
ri ,72 的 指令 是 一 个 寄存 器 到 寄存 器 的 拷贝 运算 。 它 把 寄存 器 六 的 内 容 拷贝 到 寄存 器 
Ti 中 。 
保存 运算 : 指令 ST x, r 把 寄存 器 7 中 的 值 保存 到 位 置 *。 这 个 指令 表示 赋值 x =7。 
计算 运算 : 形 如 OP dst, src, srez, 其 中 OP 是 一 个 诸如 ADD 或 SUB 的 运算 符 , 而 dst, sre, 
和 src, 是 内 存 位 置 。 这 些 位 置 不 一 定 要 相互 不 同 。 这 个 机 器 指令 的 作用 是 把 OP 所 代表 
的 运算 作用 在 位 置 src! 和 sres 中 的 值 上 ; 然后 把 这 次 运算 的 结果 放 到 位 置 dst 中 。 比 如 ， 
SUB Tam Ty Ts 时 和 Ny = Tp TS 原先 存放 在 六 中 的 值 丢失 了 , 但 是 如 果 nl 二 T3 或 者 
n, 计算 机 会 首先 读 出 原来 的 值 。 只 需要 一 个 运算 分 量 的 单 目 运算 符 没有 src2。 
无 条 件 跳 转 : 指令 BR 了 使 得 控制 流转 向 标号 为 也 的 机 器 指令 。( BR 表示 产生 分 支 )。 
条 件 跳 转 : 该 指令 的 形式 为 Becond r, L, 其 中 r 是 一 个 寄存 器 , 工 是 一 个 标号 ,而 cond 代表 
了 对 寄存 器 7 中 的 值 所 做 的 某 个 常见 测试 。 比 如 ，, 当 寄 存 器 rz 中 的 值 小 于 0 时 , BLTZ r, L 
使 得 控制 流 跳 转 到 标号 L; 否则 , 控制 流传 递 到 下 一 个 机 器 指令 。 
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我 们 假设 目标 机 具有 多 种 寻 址 模式 : 
。 在 指令 中 , 一 个 位 置 可 以 是 一 个 变量 名 x, 它 指向 分 配给 x 的 内 存 位 置 ( 即 % 的 左 值 ) 。 
。 一 个 位 置 也 可 以 是 一 个 带 有 下 标的 形 如 a(7) 的 地 址 , 其 中 a 是 一 个 变量 , 而 r 是 一 个 寄 
FERS. alr) 所 表示 的 内 存 位 置 按照 如 下 方式 计算 得 到 : a 的 左 值 加 上 存放 在 寄存 器 > 中 的 
fi. Kio, 指令 LD R1, a(R2) AY RF R1 = contents (a + contents(R2)), 其 中 
contents (x) RIR x 所 代表 的 寄存 器 或 内 存 位 置 中 存放 的 内 容 。 这 个 寻 址 方式 对 于 数组 访 
问 是 很 有用 的 , 其 中 a 是 数组 的 基地 址 ( 即 第 一 个 元 素 的 地 址 ), 而 7 中 存放 了 从 基地 址 
到 数组 a 的 某 个 元 素 所 要 经 过 的 字 节 数 。 
一 个 内 存 位 置 可 以 是 一 个 以 寄存 器 作为 下 标的 整数 。 比 如 , LD R1, 100(R2 ) 的 效果 就 是 
使 得 R1 =contents(100 + contents(R2 ) ) 。 也 就 是 说 ,首先 计算 寄存 器 R2 中 的 值 加 上 100 
得 到 的 和 , 然后 把 这 个 和 所 指向 的 位 置 中 的 值 加 载 到 R1 中 。 正 如 我 们 在 下 面 的 例子 中 
将 看 到 的 那样 ,这 个 寻 址 方式 可 以 用 于 沿 指针 取 值 。 
我 们 还 支持 另外 两 种 间接 寻 址 模式 : *r 表示 在 寄存 器 7 的 内 容 所 表示 的 位 置 上 存放 的 
内 存 位 置 。 而 *100(r) Rater 中 内 容 加 上 100 的 和 所 代表 的 位 置 上 的 内 容 所 代表 的 
WS, Kal, LD R1，* 100 (R2) 的 效果 是 把 R1 设置 为 contents (contents (100 + 
contents( R2 ) ) ) 。 也 就 是 说 , 首先 计算 寄存 器 R 中 的 内 容 加 上 100 的 和 , 取出 和 值 所 指 
的 位 置 中 的 内 容 , 再 把 这 个 内 容 代表 的 位 置 中 的 值 加 载 到 R 中 。 

。 最 后 , 我 们 支持 一 个 直接 常数 寻 址 模式 。 在 常数 前 面 有 一 个 前 级 #。 指 令 LD R1, #100 把 

整数 100 加 载 到 R1 中 , 而 ADD R1, R1, #100 则 把 100 加 到 寄存 器 R1 中 去 。 

在 指令 之 后 的 注解 由 /开头 。 


三 地 址 语句 x =y -z 可 以 使 用 下 面 的 机 器 指令 序列 实现 : 


LD Riy // RL y 
LD R2, z // R2 = z 
SUB Ri, R1, R2 // Ri = R1 - R2 
ST x, Ri // x= Ri 


也 许 我 们 能 做 得 更 好 。 一 个 优秀 的 代码 生成 算法 的 目标 之 一 是 尽 可 能 地 避免 使 用 上 面 的 全 
部 四 个 指令 。 比 如 , y ALAM z 可 能 已 经 被 计算 出 来 并 存放 在 一 个 寄存 器 中 。 如 果 是 这 样 , RN 
就 可 以 避免 相应 的 LD 步骤。 类 似 地 , 如 果 x 的 值 被 使 用 时 都 存放 在 寄存 器 中 , 并 且 之 后 不 会 再 
被 用 到 , 我 们 就 不 需要 把 这 个 值 保存 回 xo 

假设 a 是 一 个 元 素 为 8 字 节 值 ( 比如 实数 ) 的 数组 。 再 假设 a 的 元 素 的 下 标 从 0 开始 。 我 们 
可 以 通过 下 面 的 指令 序列 来 执行 三 地 址 指令 b =a[i]: 


LD Ri i Ji RIs i 

MUL R1, Ri, 8 // Ri = R1 * 8 

LD; R2, acRi) // R2 = contents(a + contents(R1)) 
ST b, R2 // b= R2 


这 里 的 第 二 步 计算 8i; 而 第 三 步 把 a 的 第 i 个 元 素 的 值 放 到 R2 中 , 这 个 元 素 位 于 离 数 组 a 
的 基地 址 8i 个 字 节 的 地 方 。 
类 似 地, 三 地 址 指令 alj] = < 所 代表 的 对 数组 a 的 赋值 可 以 实现 为 : 


LD Ri, c // Ri e 

LD R2, j // R2 = j 

MUL R2, R2, 8 // R2 = R2 *8 

ST a(R2), Ri // contents(a + contents(R2)) = R1 


为 了 实现 一 个 简单 的 指针 间接 存 取 ， 比 如 三 地 址 语句 x = * p, 我 们 可 以 使 用 如 下 的 机 器 指 
SEZ: 
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LD BI; P // Ri =p 

LD R2, O(R1) // R2 = contents(0 + contents(R1)) 

ST ix, R2 // x = R2 

通过 指针 的 赋值 语句 *p=y 可 以 类 似 地 用 如 下 的 机 器 代码 实现 : 
LD LRI oP // Rl =p 

LD R2, y // R2 =y 

ST O(R1), R2 // contents(0 + contents(Ri)) = R2 


最 后 考虑 一 个 带 条 件 跳 转 的 三 地 址 指令 : 


if x < y goto L 


它 的 等 价 的 机 器 代码 如 下 : 
LD ,li // R1 = x 
LD R2, y // R2 = y 
SUB Ri, Ri, B2 // Ri = Ri - R2 
BLTZ R1, M // if Ri <0 jump to M 


这 里 的 MX 是 从 标号 为 工 的 三 地 址 指令 所 产生 的 机 器 指令 序列 中 的 第 一 个 指令 的 标号 。 对 于 
任意 一 个 三 地 址 指令 , 我 们 希望 可 以 省 略 这 些 指令 中 的 某 些 指令 。 省 略 的 原因 可 能 是 所 需 的 运 
算 分 量 已 经 在 寄存 器 中 了 , 也 可 能 因为 结果 不 需要 存放 回 内 存 。 加 
8.2.2 程序 和 指令 的 代价 
我 们 经 常会 指出 编译 及 运行 一 个 程序 所 需 的 代价 。 根 据 我 们 在 优化 一 个 程序 时 感 兴趣 的 方面 , 我 
们 会 使 用 不 同 的 度量 。 常 用 的 度量 包括 编译 时 间 的 长 短 , 以 及 目标 程序 的 大 小 、 运 行 时 间 和 能 耗 。 
确定 编译 和 运行 一 个 程序 的 实际 代价 是 一 个 复杂 的 问题 。 总 的 来 说 , 为 一 个 给 定 的 源 程 序 
找到 一 个 最 优 的 目标 程序 是 一 个 不 可 判定 问题 ， 而 很 多 相关 的 子 问题 都 是 NP 困难 的 。 正 如 我 们 
已 经 指出 的 , 在 代码 生成 时 , 我 们 通常 必须 满足 于 那些 能 够 生成 优良 代码 但 不 一 定 是 最 优 目标 程 
序 的 启发 式 技术 。 
在 本 章 的 其 余部 分 , 我 们 将 假设 每 个 目标 语言 指令 都 有 相应 的 代价 。 为 简单 起 见 , 我们 把 一 
个 指令 的 代价 设 定 为 1 加 上 与 运算 分 量 寻 址 模式 相关 的 代价 。 这 个 代价 对 应 于 指令 中 字 的 长 度 。 
寄存 器 寻 址 模式 具有 的 附加 代价 为 0， 而 涉及 内 存 位 置 或 常数 的 寻 址 方式 的 附加 代价 为 1。 下 面 
是 一 些 例子 : 
o 指令 LD RO, R1 把 寄存 器 RI 中 的 内 容 拷贝 到 寄存 器 RO 中 。 因 为 不 要 求 附加 的 内 存 字 ， 
所 以 这 个 指令 的 代价 是 1。 

o 指令 LD RO, MX 把 内 存 位 置 X 中 的 内 容 加 载 到 寄存 器 RO 中 。 指 令 的 代价 是 2, 因为 内 存 
位 置 X 的 地 址 在 紧 跟 着 指令 的 字 中 。 

e 指令 LD Rl1，#*100(R2) 把 值 contenis(contents(100 + contents(R2))) 加 载 到 寄存 器 R1 
中 。 这 个 指令 的 代价 是 2, 因为 常数 100 存放 在 紧 跟 着 指令 的 内 存 字 中 。 

在 本 章 中 , 我 们 假设 对 于 一 个 指定 的 输入 , 目标 语言 程序 的 代价 是 当 此 程序 在 该 输入 上 运行 
时 所 执行 的 所 有 指令 的 代价 总 和 。 优 秀 的 代码 生成 算法 的 目标 是 使 得 程序 在 典型 输入 上 运行 时 
所 执行 指令 的 代价 总 和 最 小 。 我 们 将 会 看 到 , 在 某 些 情况 下 , 我 们 真 的 能 够 在 某 些 类 型 的 寄存 器 
机 器 上 为 表达 式 生 成 最 优 的 代码 。 

8.2.3 8.2 FAAS 

练习 8.2.1: 假设 所 有 的 变量 都 存放 在 内 存 中 , 为 下 面 的 三 地 址 语句 生成 代码 : 

x=1 

7 x=a 

Di oe 

4)x=a+b 

5) 两 个 语句 的 序列 
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x= b* Cc 
yatır 


练习 8. 2. 2: 假设 c Mb 是 元 素 为 4 字 节 值 的 数组 , 为 下 面 的 三 地 址 语句 序列 生成 代码 。 
1) 四 个 语句 的 序列 


x = ali] 

y = b[j] 

a[i] = y 

b[j] =x 

2) 三 个 语句 的 序列 
x = ali] 

y = bli] 

z=x*y 

3) 三 个 语句 的 序列 
x = ali] 

y = b[x] 

ali] = y 

练习 8. 2. 3: 假设 p Ma 存放 在 内 存 位 置 中 , 为 下 面 的 三 地 址 语句 序列 生成 代码 : 
2 

ZpS y 

p=pt+4 


练习 8.2.4: 假设 x、y Az 存放 在 内 存 位 置 中 , 为 下 面 的 语句 序列 生成 代码 : 


if x < y goto Li 
z=0 
goto L2 

Li: z=1 


练习 8. 2. 5: 假设 在 一 个 内 存 位 置 中 , 为 下 面 的 语句 序列 生成 代码 
Li: if i > n goto L2 
s=s +i 


L2: 


练习 8.2.6: 确定 下 列 指令 序列 的 代价 。 
E ED RO, y 
LD Rij z 
ADD RO, RO, R1 
ST x, RO 
2) iD- RO, 4 
MUL RO, RO, 8 
LD Ri, a(R0) 
STi byuRt 
3) LD RO, c 


MUL R1, Ri, 8 
ST a(Ri), RO 
4) LD RO, p 
LD R1, 0(RO) 
Sr x, (RD 
5) LD RO, p 
LD R1, x 
ST 0(RO), Ri 
6) LD RO = 
LD Riy 
SUB RO, RO, R1 
BLTZ *R3, RO 
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8.3 目标 代码 中 的 地 址 


在 本 市 中 ， 我 们 将 说 明 如 何 使 用 静态 和 栈 式 内 存 分 配 为 简单 的 过 程 调 用 和 返回 生成 代码 ， 以 
此 将 IR 中 的 名 字 转 换 成 为 目标 代码 中 的 地 址 。 在 7. 1 节 中 ， 我 们 描述 了 每 个 正在 执行 的 程序 是 
如 何在 它 的 逻辑 地 址 空间 上 运行 的 。 这 个 空间 被 划分 成 为 四 个 代码 及 数据 区 域 : 

1) 一 个 静态 确定 的 代码 区 Code。 这 个 区 存放 可 执行 的 目标 代码 。 目标 代码 的 大 小 可 以 在 编 
译 时 刻 确定 。 

2) 一 个 静态 确定 的 静态 数据 区 Statice。 这 个 区 存放 全 局 常量 和 编译 器 生成 的 其 他 数据 。 全 
局 常量 和 编译 器 数据 的 大 小 也 可 以 在 编译 时 刻 确定 。 

3) 一 个 动态 管理 的 堆 区 Heap。 这 个 区 存放 程序 运行 时 刻 分 配 和 有 释放 的 数据 对 象 。Heap 的 大 
小 不 能 在 编译 时 刻 静 态 确定 。 

4) 一 个 动态 管理 的 栈 区 Stack。 这 个 区 存放 过 程 的 活动 记录 。 活 动 记 录 会 随 着 过 程 的 调用 和 
返回 被 创建 和 消除 。 和 堆 区 一 样 , 栈 区 的 大 小 也 不 能 在 编译 时 刻 确定 。 

8.3.1 静态 分 配 

为 了 说 明 简化 的 过 程 调用 和 返回 的 代码 生成 , 我 们 关注 下 面 的 三 地 址 语句 : 

e call callee 

èe return 

e halt 

。 action, 这 是 代表 其 他 三 地 址 语句 的 占 位 符 。 

活动 记录 的 大 小 和 布局 是 由 代码 生成 器 通过 存放 于 符号 表 中 的 名 字 的 信息 来 确定 的 。 我 们 
将 首先 说 明 如 何在 过 程 调用 时 在 一 个 活动 记录 中 存放 返回 地 址 , 以 及 如 何在 过 程 调用 结束 后 把 
控制 返回 到 这 个 地 址 。 为 方便 起 见 , 我 们 假设 活动 记录 的 第 一 个 位 置 存放 返回 地 址 。 

我 们 首先 考虑 实现 最 简单 情况 ( 即 静态 分 配 ) 时 的 代码 。 这 里 ,中 间 代 码 中 的 call callee 语 
名 可 以 用 包含 两 个 目标 机 指令 的 序列 来 实现 ; 


ST callee.staticArea, #here + 20 
BR callee.codeArea 


ST 指令 把 返回 地 址 保存 到 callee 的 活动 记录 的 开始 处 , 而 BR 把 控制 传递 到 被 调用 过 程 callee 的 
目标 代码 上 。 属 性 callee. staticArea 是 一 个 常量 , 给 出 了 callee 的 活动 记录 的 开始 处 的 地 址 , 而 属 
性 callee. codeArea 也 是 一 个 常量 , 指向 运行 时 刻 内 存 中 Code 区 中 被 调用 过 程 callee 的 第 一 个 指令 
的 地 址 。 

sr 指令 中 的 运算 分 量 因 ere +20 是 返回 地 址 的 文字 表示 , 它 是 紧 跟 在 BR 指令 之 后 的 指令 的 
地 址 。 我 们 假设 大 ere 是 当前 指令 的 地 址 , 而 调用 序列 中 的 三 个 常量 加 上 两 个 指令 的 长 度 为 5 个 
z, 即 20 个 字 节 。 

过 程 代码 的 结尾 处 是 一 个 返回 到 调用 者 过 程 的 指令 。 但 是 没有 调用 者 的 第 一 个 过 程 例外 ， 
它 的 最 后 一 个 指令 是 HALT。 这 个 指令 把 控制 返回 给 操作 系统 。 一 个 return 语 名 可 以 使 用 一 个 
简单 的 跳 转 语句 实现 : 


BR *callee.staticArea 
它 把 控制 流转 到 保存 在 callee 的 活动 记录 开始 位 置 的 地 址 上 。 
假设 我 们 有 下 面 的 三 地 址 代码 ， 
// c 的 代码 


action, 
call p 
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action, 
halt 
// p 的 代码 
action; 
return 


图 8-4 给 出 了 这 个 三 地 址 代码 的 目标 程序 。 我 们 使 用 伪 指 令 ACTION 来 代表 执行 语句 
action 的 机 器 指令 序列 。 这 些 action 语句 代表 了 和 本 次 讨论 无 关 的 三 地 址 代码 。 我 们 假定 
过 程 c 的 代码 从 地 址 100 开始 , 而 过 程 p 从 地 址 200 开始 。 我 们 假定 每 个 ACTION 伪 指 令 占 用 
20 个 字 节 。 我 们 还 假定 这 些 过 程 的 活动 记录 以 静态 方式 分 配 ,其 位 置 分 别 是 300 和 364。 


/1/5 的 代码 
100: ACTION, // action; 的 代码 
120: ST 364, #140 // 在 位 置 364 上 存放 返回 地 址 140 
132: BR 200 // 调用 Pp 
140: ACTION» 
160: HALT // 返回 操作 系统 
// PP 的 代码 
200: ACTION; 


220: BR *364 // 返回 在 位 置 364 保存 的 地 址 处 


// 300-363 Fi ¢ 的 活动 记录 
300: // 返回 地 址 








304: // < 的 局 部 数据 

z // 364-451 FHP RREZE 
364: // 返回 地 址 
368: // PP 的 局 部 数据 


图 8-4 静态 分 配 的 目标 代码 
从 地 址 100 开始 的 指令 实现 了 过 程 c 的 语句 : 


action,; call p; action); halt 
因此 程序 的 运行 从 地 址 100 上 的 指令 ACTION, 开始 。 在 地 址 120 上 的 ST 指令 把 返回 地 址 140 
存放 在 机 器 状态 字段 中 , 也 就 是 p 的 活动 记录 的 第 一 个 字 中 。 在 地 址 132 上 的 BR 指令 把 控制 转 
移 到 被 调用 过 程 p 的 目标 代码 的 第 一 个 指令 。 

执行 了 ACTION; 之 后 , 位 于 地 址 220 的 跳 转 指令 被 执行 。 因 为 上 面 的 调用 代码 序列 把 位 置 
140 存放 在 地 址 364 中 , 因此 当 位 于 地 址 220 的 BR 语句 执行 时 ，* 364 代表 140。 所 以 当 过 程 p 
结束 时 , 控制 流 返回 到 地 址 140, 过 程 c 继续 执行 。 oO 
8.3.2 栈 分 配 

如 果 在 保存 活动 记录 时 使 用 相对 地 址 , 静态 分 配 就 可 以 变 成 栈 分 配 。 但 是 在 栈 分 配方 式 中 ， 
只 有 等 到 运行 时 刻 才 能 知道 一 个 过 程 的 活动 记录 的 位 置 。 这 个 位 置 通常 存放 在 一 个 寄存 器 里 面 ， 
因此 活动 记录 中 的 字 可 以 通过 相对 于 寄存 器 中 值 的 偏 移 量 来 访问 。 我们 的 目标 机 的 下 标 地 址 模 
式 可 以 方便 地 完成 这 种 访问 。 

正如 我 们 在 第 7 章 中 已 经 看 到 的 , 活动 记录 的 相对 地 址 可 以 用 相对 于 活动 记录 中 的 任 一 已 知 
位 置 的 偏 移 量 来 表示 。 为 方便 起 见 , 我 们 将 在 寄存 器 SP 中 维护 一 个 指向 栈 顶 的 活动 记录 的 开始 
处 的 指针 , 这 样 就 可 以 使 所 有 的 偏 移 量 都 是 正 数 。 当 发 生 过 程 调 用 时 , 调用 过 程 增加 sp 的 值 ， 
并 把 控制 传递 到 被 调用 过 程 。 在 控制 返回 到 调用 者 时 ,我们 减少 Sp 的 值 ,从 而 释放 被 调用 过 程 
的 活动 记录 。 

第 一 个 过 程 的 代码 把 SP 设置 成 内 存 中 栈 区 的 开始 位 置 ,完成 对 栈 的 初始 化 ， 


336 第 8 章 


LD SP, #stackStart 


// 初始 化 栈 
code for the first procedure 
HALT // 结束 执行 


一 个 过 程 调用 指令 序列 增加 SP 的 值 , 保存 返回 地 址 ， 并 把 控制 传递 到 被 调用 过 程 : 
ADD SP, SP, #caller.recordSize // 增加 栈 指针 
ST O(SP), #here+ 16 // 保存 返回 地 址 
BR callee.codeArea // 转移 到 被 调用 过 程 


运算 分 量 #ealler recordSize 表示 一 个 活动 记录 的 大 小 , 因此 avd 指令 使 得 SP 指向 下 一 个 活动 记 
录 。 在 ST 指令 中 的 运算 分 量 加 ere +16 是 跟随 在 BR 之 后 的 指令 的 地 址 ， 它 被 存放 在 SP 所 指向 


的 地 址 中 。 
返回 指令 序列 包含 两 个 部 分 。 被 调用 过 程 使 用 下 面 的 指令 把 控制 传递 到 返回 地 址 : 
BR ¥*0(SP) // 返回 给 调用 者 





// m 的 代码 


actioni 


在 BR 中 使 用 * 0( SP) 的 原因 是 我 们 需要 两 层 间 接 寻 址 : 
0( SP) 是 活动 记录 的 第 一 个 字 所 在 的 位 置 , 而 * 0(SP) 是 存 eae 
放 在 那里 的 返回 地 址 。 halt 
返回 指令 序列 的 第 二 部 分 在 调用 者 中 , 这 个 序列 减少 
sp 的 值 , 因此 把 SP 恢复 为 以 前 的 值 。 也 就 是 说 , 在 减法 运 
算 之 后 ,SP 指向 调用 者 的 活动 记录 的 开始 处 : 


SUB SP, SP, #caller.recordSize // 栈 指针 减 1 

第 7 章 中 包含 了 有 关 调用 指令 序列 以 及 在 调用 过 程 和 被 
调用 过 程 之 间 进行 任务 分 配 的 折衷 方案 的 更 广泛 的 讨论 。 
图 8-5 中 的 程序 是 前 一 章 中 的 快速 排序 程序 的 一 
个 抽象 。 过 程 9 是 递归 的 , 因此 在 同一 时 刻 可 能 有 多 个 活跃 
的 g 的 活动 记录 。 | 

假设 过 程 m、p 和 a 的 活动 记录 的 大 小 已 经 确定 , 分 别 是 msize、psize 和 gsize。 每 个 活动 记录 
的 第 一 个 字 存 放 返 回 地 址 。 我 们 随意 地 假设 这 些 过 程 的 代码 分 别 从 地 址 100、200 和 300 处 开始 ， 
并 假设 栈 区 在 地 址 600 处 开始 。 目 标 程序 在 图 8-6 中 显示 。 


// maa 


// P 的 代码 
action3 
return 


// qa 的 代码 


action, 
call p 
action; 
call q 
actiong 
call q 
return 


: LD SP, #600 

: ACTION; 

: ADD SP, SP, #msize 
: ST O(SP), #152 

: BR 300 

: SUB SP, SP, #msize 
: ACTION, 

: HALT 


: ACTION; 
: BR *0(SP) 


: ACTION, 

: ADD SP, SP, #qsize 
: ST O(SP), #344 

: BR 200 

: SUB SP, SP, #qsize 
: ACTION, 





// 初始 化 栈 

// action 的 代码 

// 调用 指令 序列 的 开始 
// 将 返回 地 址 压 入 栈 
// 调用 q 

// 恢复 SP 的 值 


// P 的 代码 
// 返回 


// 4 的 代码 
// 包含 有 跳 转 到 456 的 条 件 转移 指令 


// 将 返回 地 址 压 和 人 栈 
// 调用 P 


图 8-6， 栈 式 分 配 时 的 目标 代码 


代码 生成 337 





: ADD SP, SP, #qsize 

: BR O(SP), #396 // 将 返回 地 址 压 和 人 栈 
: BR 300 // 调用 q 

: SUB SP, SP, #qsize 

: ACTION, 

: ADD SP, SP, #gsize 


: ST O(SP), #440 // 将 返回 地 址 压 人 栈 
: BR 300 // 调用 

: SUB SP, SP, #qsize 

: BR *0(SP) // 返回 





// 楼 区 的 开始 处 
图 8-6 (2%) 


我 们 假设 ACTION, 包含 了 一 个 条 件 跳 转 指令 , 跳 转 到 a 的 返回 代码 序列 开始 地 址 456; 否 
则 , 递归 过 程 a 将 不 得 不 永远 调用 自己 。 

令 msize、psize 和 gsize 分 别 是 20、40 和 60。 在 地 址 100 处 的 第 一 个 指令 把 SP 初始 化 为 600， 
即 栈 区 的 开始 地 址 。 在 控制 从 m 转 向 aq 的 前 一 刻 , SP 中 的 值 是 620( 因 为 msize 为 20)。 BAR 4 a 
调用 p 时 , 在 地 址 320 处 的 指令 把 SP 增加 到 680, EI p 的 活动 记录 的 开始 处 ; 当 控 制 返回 到 a 的 
时 候 ，SP 回复 到 620。 如 果 接 下 来 的 两 个 对 a 的 递归 调用 立刻 返回 , 那么 执行 过 程 中 SP 的 最 大 
值 就 是 680。 但 是 请 注意 , 栈 区 中 被 使 用 的 最 后 的 位 置 是 739, 因为 从 位 置 680 开始 的 gq 的 活动 
记录 总 共有 60 个 字 节 。 oO 
8.3.3 名 字 的 运行 时 刻 地 址 

存储 分 配 策略 以 及 过 程 的 活动 记录 中 局 部 数据 的 布局 决定 了 如 何 访问 名 字 对 应 的 内 存 位 置 。 
在 第 6 章 , 我 们 假设 一 个 三 地 址 语句 中 的 名 字 实 际 上 是 一 个 指向 该 名 字 的 符号 表 条 目的 指针 。 这 
个 方法 有 一 个 极 大 的 好 处 , 它 使 得 编译 器 更 加 易于 移植 , 因为 即使 当 编 译 器 被 移植 到 使 用 不 同 运 
行 时 刻 组 织 方式 的 其 他 机 器 时 ,其 前 端 也 不 需要 修改 。 但 是 从 另 一 个 方面 来 看 , 在 生成 中 间 代 码 
时 生成 特定 的 访问 步骤 对 于 一 个 优化 编译 器 也 有 极 大 的 好 处 , 因为 这 使 得 优化 器 能 够 利用 原本 
在 简单 的 三 地 址 语句 中 不 可 见 的 细节 。 

在 任何 一 种 情况 下 ,名字 最 终 必须 被 替代 为 访问 存储 位 置 的 代码 。 在 这 里 , 我 们 考虑 简单 的 
三 地 址 拷贝 语句 x=0 的 一 些 细节 。 假 设 在 处 理 完 一 个 过 程 的 声明 部 分 后 , x 的 符号 表 条 目 包含 
了 x 的 相对 地 址 12。 如 果 x 被 分 配 在 一 个 从 地 址 static 开始 的 静态 分 配 区 域 中 , 那么 x 的 实际 运 
行 时 刻 地 址 是 static +12。 虽 然 编译 器 最 终 可 以 在 编译 时 刻 确定 static +12 的 值 , 但 是 在 生成 访问 
该 名 字 的 中 间 代 码 时 可 能 还 不 知道 静态 区 域 的 位 置 。 在 这 种 情况 下 , 生成 “计算 ”static + 12 的 三 
地 址 代码 是 有 意义 的 。 当 然 我 们 要 理解 , 这 个 计算 在 程序 运行 之 前 就 会 完成 : 它 或 者 在 代码 生成 
阶段 完成 , 或 者 由 加 载 器 完成 。 那 么 , 赋值 语句 x =0 被 翻译 成 


static[1i2] = 0 


如 果 静 态 区 从 地 址 100 开始 , 这 个 语句 的 目标 代码 是 


LD 112, #0 
8.3.4 8.3 节 的 练习 
练习 8. 3. 1: 假设 使 用 栈 式 分 配 而 寄存 器 SP 指向 栈 的 顶端 , 为 下 列 的 三 地 址 语句 生成 代码 。 


call p 
call q 
return 
call r 
return 
return 


338 第 8 章 





练习 8. 3. 2: 假设 使 用 栈 式 分 配 而 寄存 器 SP 指向 栈 的 顶端 , 为 下 列 的 三 地 址 语句 生成 代码 。 
1)x=1 

2)x=a 

3)x=a+1 

4)x=a+b 

5) 两 个 语句 的 序列 


x=b*¥e 
7 


练习 8. 3. 3: 假设 使 用 栈 式 分 配 , 且 假 设 a Alb 都 是 元 素 大 小 为 4 字 节 的 数组 , 再 次 为 下 面 
的 三 地 址 语句 生成 代码 。 
1) 四 个 语句 的 序列 


x = ali] 
y = b[j] 
ali] = y 
b[j] = x 
2) 三 个 语句 的 序列 


3) 三 个 语句 的 序列 
x = ali] 
y = blz] 
ali] = y 


8.4 基本 块 和 流 图 


本 节 介绍 一 种 用 图 来 表示 中 间 代 码 的 方法 。 即 使 这 个 图 没有 显 式 地 被 代码 生成 算法 生成 ， 
它 对 于 讨论 代码 生成 也 是 有 帮助 的 。 上 下 文 信息 有 助 于 更 好 地 生成 代码 。 正 如 我 们 将 在 8.8 节 
看 到 的 , 如 果 我 们 知道 程序 中 的 值 是 如 何 被 定 值 和 使 用 的 , 我 们 就 可 以 更 好 地 分 配 寄 存 器 。 我 们 
还 将 在 8. 9 节 看 到 , 通过 检查 三 地 址 语句 序列 , 我 们 可 以 更 好 地 完成 指令 选择 工作 。 

这 个 表示 方法 可 以 按照 如 下 方法 构造 : 

1) 把 中 间 代码 划分 成 为 基本 块 (basic block) 。 每 个 基本 块 是 满足 下 列 条 件 的 最 大 的 连续 三 
地 址 指令 序列 。 

D 控制 流 只 能 从 基本 块 中 的 第 一 个 指令 进入 该 块 。 也 就 是 说 , 没有 跳 转 到 基本 块 中 间 的 转 
移 指 令 。 

@ 除了 基本 块 的 最 后 一 个 指令 , 控制 流 在 离开 基本 块 之 前 不 会 停机 或 者 跳 转 。 

2) 基本 块 形成 了 流 图 (flow graph) 的 结 点 。 而 流 图 的 边 指明 了 哪些 基本 块 可 能 紧 随 一 个 基本 
块 之 后 运行 。 

从 第 9 章 开始 , 我 们 将 讨论 在 流 图 上 的 多 种 转换 。 这 些 转 换 把 原 有 的 中 间 代 码 转换 成 为 “ 优 
化 后 "的 中 间 代 码 , 而 从 “优化 后 ”的 中 间 代 码 可 以 生成 更 好 的 目标 代码 。 将 “优化 后 ”的 中 间 代 
码 转换 为 目标 机 器 代码 的 工作 将 使 用 本 章 中 的 代码 生成 技术 完成 。 


— 





中 断 的 影响 
有 人 认为 ,只 要 控制 流 到 达 基 本 块 的 开始 处 就 必然 会 继续 执行 到 基本 块 结束 处 , 但 是 这 
个 说 法 需要 一 些 仔细 的 考虑 。 有 很 多 原因 会 导致 一 个 中 断 使 得 控制 流离 开 基本 块 , 甚至 可 能 
不 再 返回 , 但 这 些 中 断 并 没有 在 代码 中 显 式 地 反映 出 来 。 比 如 , 一 个 像 x =y /2 这 样 的 指令 
看 起 来 不 影响 控制 流 。 但 是 如 果 z 是 0, 此 指令 实际 上 可 能 使 程序 异常 中 止 。 











代码 生成 339 








我 们 用 不 着 担心 这 种 可 能 性 。 理 由 如 下 : 构造 基本 块 的 目的 是 优化 代码 。 一 般 来 说 , 4 
一 个 中 断 发 生 时 , 它 要 么 被 适当 处 理 然后 将 控制 返回 到 引起 中 断 的 指令 , 就 好 像 控 制 流 从 来 
没有 离开 过 ; 要 么 程序 会 中 止 并 报错 。 在 后 一 种 情况 下 ， 即 使 我 们 在 优化 时 假设 控制 流 会 一 
直到 达 基 本 块 的 结尾 , 优化 的 结果 也 不 会 有 错 , 因为 程序 本 来 就 不 会 给 出 预计 的 结果 。 








8.4.1 基本 块 

我 们 的 第 一 项 工作 是 把 一 个 三 地 址 指令 序列 分 割 成 为 基本 块 。 我 们 以 第 一 个 指令 作为 一 个 
新 基本 块 的 开始 , 然后 不 断 把 后 续 的 指令 加 进去 , 直到 我 们 碰 到 一 个 无 条 件 跳 转 、 条 件 跳 转 指令 
或 者 下 一 个 指令 前 面 的 标号 为 止 。 当 没有 跳 转 和 标号 时 , 控制 流 直接 从 一 个 指令 到 达 下 一 个 指 
令 。 这 个 想法 在 下 面 的 算法 中 形式 化 地 表示 出 来 。 
把 三 地 址 指令 序列 划分 成 为 基本 块 。 








输入 : 一 个 三 地 址 指令 序列 。 Swen 
输出 : 输入 序列 对 应 的 一 个 基本 块 列表 , 其 中 每 个 指令 eu | 
恰好 被 分 配给 一 个 基本 块 。 te 
方法 : 首先 , 我 们 确定 中 间 代码 序列 中 哪些 指令 是 首 指 ry 


令 (leader)， 即 某 个 基本 块 的 第 一 个 指令 。 跟 在 中 间 程 序 末 
端 之 后 的 指令 的 不 包含 在 首 指令 集合 中 。 选 择 首 指令 的 规则 
如 下 : 

1) 中 间 代 码 的 第 一 个 三 地 址 指令 是 一 个 首 指令 。 

2) 任意 一 个 条 件 或 无 条 件 转移 指令 的 目标 指令 是 一 个 


9) if j <= 10 goto (3) 
10) i=i+i 

11). if i <= 10 goto (2) 
12) i=1 

13) te= 4 = 41 

14) 46: = 88% t5 

15) alt6] = 1.0 

Li ae 








首 指令 。 if i <= 10 goto (13) 
3) 紧 跟 在 一 个 条 件 或 无 条 件 转移 指令 之 后 的 指令 是 一 : 
个 首 指令 。 图 8 了 7 把 一 个 10 x10 的 和 矩阵 


然后 ， 每 个 首 指令 对 应 的 基本 块 包括 了 从 它 自 己 开始 ， 设置 成 单位 矩阵 的 中 间 代码 
直到 下 一 个 首 指令 (不 含 ) 或 者 中 间 程 序 的 结尾 指令 之 间 的 


for i from 1 to 10 do 


所 有 指令 。 E for j from 1 to 10 do 
DEJ 8-7 中 的 中 间 代码 把 一 个 10 x10 的 矩阵 a 设置 。 | 6， BI 





成 一 个 单位 矩阵 。 这 段 代码 来 自 哪里 并 不 重要 ,， 它 也 许 是 从 dips] = 10; 
图 8-8 的 伪 代 码 中 翻译 得 到 的 。 在 生成 这 个 中 间 代码 的 时 
候 , 我 们 假设 每 了 个 实数 值 的 数组 元 素 正 8 AH, ame | BES 图 87 的 源 代码 
a 按 行 存放 。 

首先 , 根据 算法 8.5 的 规则 (1) 可 知 第 一 个 指令 是 个 首 指令 。 为 了 找到 其 他 的 首 指 令 , R 
们 要 找到 跳 转 指令 。 在 这 个 例子 中 有 三 个 距 转 指令 (全 部 是 条 件 跳 转 指令 ), 即 指令 9、11 和 17。 
根据 规则 (2) ,这 些 跳 转 指令 的 目标 是 首 指令 , 它们 分 别 是 指令 3、2 和 13。 然 后 ,根据 规则 (3)， 
跟 在 一 个 跳 转 指令 后 面 的 每 个 指令 都 是 首 指令 ， 即 指令 10 和 12。 注 意 ,在 这 段 代码 里 没有 限 在 
指令 17 后 面 的 指令 。 假 如 有 的 话 ; 那么 第 18 个 指令 也 是 一 个 首 指令 。 

我 们 可 以 得 出 结论 : 指令 1、2、3、10、12 和 13 是 首 指令 。 每 个 首 指令 对 应 的 基本 块 包括 了 
从 它 开始 直到 下 一 个 首 指 令 之 前 的 所 有 指令 。 因 此 ,指令 1 的 基本 块 就 是 指令 1 指令 2 的 基本 
块 是 指令 2。 但 首 指令 3 的 基本 块 包含 了 从 指令 3 到 指令 9 的 所 有 指令 。 指 令 10 的 基本 块 是 10 
和 11; 指令 12 的 基本 块 仅仅 包含 指令 12, 而 指令 13 的 基本 块 是 指令 13 到 17。 o 
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8.4.2 后续 使 用 信息 

知道 一 个 变量 的 值 接 下 来 会 在 什么 时 候 使 用 对 于 生成 良好 的 代码 是 非常 重要 的 。 如 果 一 个 
恋 量 的 值 当前 存放 在 一 个 寄存 器 中 , 且 之 后 一 直 不 会 被 使 用 , 那么 这 个 寄存 器 就 可 以 被 分 派 给 男 
TER. 

在 一 个 三 地 址 语句 中 对 一 个 名 字 的 使 用 (use) 的 定义 如 下 。 假设 三 地 址 语句 i 给 x 赋 了 一 个 
值 。 如 果 语 句 j 的 一 个 运算 分 量 为 x, 并 且 从 语句 i 开始 可 以 通过 未 对 x 进行 赋值 的 路 径 到 达 语 名 
j, 那么 我 们 说 语句 7 使 用 了 在 语句 i 处 计算 得 到 的 x 的 值 。 我们 可 以 进 二 步 说 % 在 语句 i 人 处 活跃 
(live), | 

对 每 个 类 似 于 x*=y+z 的 三 地 址 语句 ; 我 们 希望 确定 对 x、y 和 z 的 下 一 次 使 用 是 什么 。 当 前 
我 们 不 考虑 在 包含 本 三 地 址 语句 的 基本 块 之 外 的 使 用 。 

我 们 用 来 确定 活跃 性 和 后 续 使 用 信息 的 算法 对 每 个 基本 块 进 行 一 次 反 向 的 遍历 。 我 们 把 得 
到 的 信息 存放 到 符号 表 中 。 使 用 算法 8. 5 中 给 出 的 方法 , 我 们 可 以 很 容易 地 通过 扫描 一 个 三 地 址 
语句 流 找到 各 个 基本 块 的 结尾 。 因 为 过 程 可 能 有 副作用 , 为 方便 起 见 , 我 们 假设 每 一 个 过 程 调 用 
指令 是 一 个 新 的 基本 块 的 开始 。 
对 一 个 基本 块 中 的 每 一 个 语句 确定 活跃 性 与 后 续 使 用 信息 。 

WA: 一 个 三 地 址 语句 的 基本 块 B, 我 们 假设 在 开始 的 时 候 符号 表 显 示 B 中 的 所 有 非 临 时 变 
量 都 是 活跃 的 。 

输出 : 对 于 B 的 每 一 个 语句 i: way tz, 我 们 将 x、y 及 z 的 活跃 性 信息 及 后 续 使 用 信息 关联 
$i i. 

方法 : RIA B 的 最 后 一 个 语句 开始 , 反 向 扫描 到 B 的 开始 处 。 对 于 每 个 语句 i x =Y +z, 
我 们 做 下 面 的 处 理 : 

1) 把 在 符号 表 中 找到 的 有 关 x、y 和 z 的 当前 后 续 使 用 和 活跃 性 信息 与 语句 i 关联 起 来 。 

2) 在 符号 表 中 , 设置 «为 “不 活跃 "和 “无 后 续 使 用 ”。 

3) 在 符号 表 中 , 设置 y 与 z 为 “活跃 ”, 并 把 它们 的 下 一 次 使 用 设置 为 语句 i 

ERE, 我 们 使 用 + 作为 代表 任意 运算 符 的 符号 。 如 果 三 地 址 语句 i 形 如 x*= +y 或 者 *=Y， 
那么 处 理 步 又 依然 和 上 面相 同 , 只 是 忽略 了 对 z 的 处 理 。 注 意 , 步骤 (2) 和 步 又 (3 ) 的 顺序 不 能 颠 
倒 , 因为 x 可 能 就 是 y 或 者 z。 O 
8.4.3 HA 

当 将 一 个 中 间 代 码 程 序 划 分 成 为 基本 块 之 后 , 我 们 用 一 个 流 图 来 表示 它们 之 间 的 控制 流 。 
流 图 的 结 点 就 是 这 些 基 本 块 。 从 基本 块 B 到 基本 抉 C 之 间 有 一 条 边 当 且 仅 当 基 本 块 C 的 第 一 个 
指令 可 能 紧 跟 在 B 的 最 后 一 个 指令 之 后 执行 。 存 在 这 样 一 条 边 的 原因 有 两 种 : 

© 有 一 个 从 B 的 结尾 跳 转 到 C 的 开头 的 条 件 或 无 条 件 跳 转 语句 。 

o 按照 原来 的 三 地 址 语句 序列 中 的 顺序 , C RRE B 之 后 , 且 B 的 结尾 不 存在 无 条 件 跳 转 

语句 。 

RATB Æ C 的 前 驱 (predecessor), 而 C 是 B 的 一 个 后 继 (successor)。 

我 们 通常 会 增加 两 个 分 别称 为 “入 口 "(entry) 和 “ 出口"(exit) 的 结 点 。 它 们 不 和 任何 可 执行 
的 中 间 指 令 对 应 。 从 入 口 到 流 图 的 第 一 个 可 执行 结 点 ( 即 包 含 了 中 间 代 码 的 第 一 个 指令 的 基本 
块 ) 有 一 条 边 。 从 任何 包含 了 可 能 是 程序 的 最 后 执行 指令 的 基本 块 到 出 日 有 一 条 边 。 如 果 程 序 的 
最 后 指令 不 是 一 个 无 条 件 转移 指令 ; 那么 包含 了 程序 的 最 后 一 条 指令 的 基本 块 是 出 口 结 点 的 一 
个 前 驱 。 但 任何 包含 了 跳 转 到 程序 之 外 的 跳 转 指令 的 基本 块 也 是 出 口 结 点 的 前 驱 。 
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EEE 从 Ws.6 中 构造 出 的 基本 块 可 以 生成 图 8.9 中 所 示 的 流 图。 入 口 结 点 指向 基本 块 B，， 


因为 B 包含 了 这 个 程序 的 第 一 个 指令 。Bi 的 唯 
一 后 继 是 By, 因为 By 的 结尾 不 是 一 个 无 条 件 跳 


















































转 指令 , HB, 的 首 指令 紧 跟 在 Bi 的 结尾 指令 a E 1 

moe. or 
基本 块 B 有 两 个 后 继 。 其 中 的 一 个 是 它 本 | 

身 , 因为 B 的 首 指令 ( 即 指令 3) 是 B 结尾 处 的 条 aoe 

件 跳 转 指令 ( 即 指令 9) 的 目标 。 另 一 个 后 继 是 及， 名 人 

因为 控制 流 可 能 穿越 B, 结尾 处 的 条 件 跳 转 指令 而 P atts) zol 

到 达 By 的 首 指令 。 [if j <= 10 goto By 
只 有 By 指向 流 图 的 出 口 结 点 ,因为 到 达 紧 跟 | 

在 流 图 对 应 的 程序 之 后 的 代码 的 唯一 方式 是 穿越 。 局 PERTEN 

Be 结尾 处 的 条 件 跳 转 指令 。 口 

8. 4. 4 ， 流 图 的 表示 方式 EE 
首先 ,从 图 8-9 中 可 以 看 出 , 在 流 图 里 面 把 到 | 

达 指 令 的 序号 或 标号 的 跳 转 指令 替换 为 到 达 基 本 

块 的 跳 转 ， 这么 做 是 很 正常 的 。 回 忆 一 下 , 所 有 条 B alte] = 1.0 

件 或 无 条 件 跳 转 指令 总 是 跳 转 到 某 些 基本 块 的 首 Piel ie got’ Be 

指令 , 而 现在 这 些 跳 转 指令 指向 了 相应 的 基本 块 。 

这 么 做 的 原因 是 ,在 流 图 构造 完成 之 后 经 常会 对 多 

个 基本 块 中 的 指令 做 出 实质 性 的 改变 。 如 果 跳 转 图 8.9 “基于 图 8.7 构造 的 流 图 


的 目标 是 指令 , 我 们 将 不 得 不 在 每 次 改变 了 某 个 目 
标 指令 之 后 修正 跳 转 指令 的 目标 。 

流 图 就 是 通常 的 图 , 它 可 以 用 任何 适合 表示 图 的 数据 结构 来 表示 。 结 点 ( 即 基本 块 ) 的 内 容 
种 要 有 它们 自己 的 表示 方式 。 我 们 可 以 用 一 个 指向 该 基本 块 在 三 地 址 指令 数组 中 的 首 指令 的 指 
针 ， 再 加 上 基本 块 的 指令 数量 或 一 个 指向 结尾 指令 的 指针 来 表示 结 点 的 内 容 。 但 是 ,因为 我 们 可 
能 会 频繁 改变 一 个 基本 块 中 的 指令 数量 ,所 以 为 每 个 基本 块 创建 一 个 指令 链表 是 一 种 高 效 的 表 
示 方 法 。 
8.4.5 循环 

R while 语句 、do-while 语句 和 for 语句 这 样 的 程序 设计 诸 言 构造 自然 地 把 循环 引信 到 程序 
中 。 因 为 事实 上 每 个 程序 会 花 很 多 时 间 执行 循环 , 所 以 对 于 一 个 编译 器 来 说 ,为 循环 生成 优良 的 
代码 就 变 得 非常 重要 。 很 多 代码 转换 依赖 于 对 流 图 中 “循环 ”的 识别 。 如 果 下 列 条 件 成 立 , 我们 
就 说 流 图 中 的 一 个 结 点 集合 工 是 一 个 循环 。 

1) 在 并 中 有 一 个 被 称 为 循环 入 口 (loop entry) 的 结 点 ， 它 是 唯一 的 其 前 驱 可 能 在 工 之 外 的 结 
点 。 也 就 是 说 , 从 整个 流 图 的 和 人口 结 点 开始 到 /中 的 任何 结 点 的 路 径 都 必然 经 过 循环 人 口 结 点 ， 
并 且 这 个 循环 入口 结 点 不 是 整个 流 图 的 入 口 结 点 本 身 。 

2) 了 中 的 每 个 结 点 都 有 一 个 到 达 工 的 人口 结 点 的 非 空 路 径 ， 并 生 该 路 径 全 部 在 上 中。 
图 8-9 中 的 流 图 有 三 个 循环 : 

1) B; 自身 

2) B 自身 
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3): Bay Bay Bat 

其 中 的 前 两 个 循环 都 由 单一 结 点 组 成 ， 这 些 结 点 都 有 到 其 自身 的 边 。 比 如 ,Bs 形成 一 个 以 
Bs 本 身 为 人 口 结 点 的 循环 。 请 注意 ， 循环 的 第 二 个 条 件 要 求 有 一 个 从 By 到 本 身 的 非 空 路 径 。 因 
此 , 像 B, 这 样 的 单一 结 点 ( 它 没有 一 条 B>B, 的 边 ) 不 是 循环 ， 因为 没有 从 Bs 到 其 自身 , HE 
集合 | B,1 中 的 非 空 路 径 。 

第 三 个 循环 L= {B,, Bs, B4} 的 循环 入 口 结 点 是 B,o 请 注意 ， 这 三 个 结 点 中 只 有 B, 有 一 个 
不 在 L 中 的 前 驱 B1。 ME, 这 三 个 结 点 中 都 有 在 工 中 且 到 达 B 的 非 空 路 径 。 比如 , M B 开始 就 
有 路 径 B, 一 B3 一 Bs 一 B,。 E 
8.4.6 8.4 节 的 练习 

练习 8. 4. 1: 图 8-10 是 一 个 简单 的 矩 「 for G30; icni i++) 

阵 乘法 程序 。 for (j=0; j<ns j++) 

1) 假设 矩阵 的 元 素 是 需要 STEW |e G0 a uy 
的 数值 ， 而 且 矩 阵 按 行 存放 。 把 程序 翻译 | for (3-0; Jems o 
成 为 我 们 在 本 节 中 一 直 使 用 的 那 种 三 地 cli (j] = c[i][j] + a[i] Cx] #b 0k) [j]; 
址 语句 。 

2) 为 (1) 中 得 到 的 代码 构造 流 图 。 图 8-10 ”一 个 矩阵 相 乘 算法 

3) 找 出 在 (2) 中 得 到 的 流 图 的 循环 。 

练习 8.4.2: 图 8-11 中 是 计算 从 2 ~n 之 间 素 数 个 数 的 代码 。 它 在 一 个 适当 大 小 的 数组 a。 上 
使 用 得 法 来 完成 计算 。 也 就 是 说 , 最 后 [让 为 真 仅 当 没有 小 于 等 于 / 的 质数 可 以 整除 i 我 们 一 
开始 把 所 有 的 a[ 让 初始 化 为 TRUE; 如 果 我 们 找到 了 7 的 一 个 因子 , 就 把 a[ 站 设置 为 PALSE。 

1) 把 程序 翻译 成 为 我 们 在 本 节 中 使 用 的 那 种 三 地 址 语句 序列 。 这 里 假设 一 个 整数 需要 4 个 
字 节 存放 。 

2) 为 在 (1) 中 得 到 的 代码 构造 流 图 。 

3) 找 出 在 (2) 中 得 到 的 流 图 的 循环 。 

for (i=2; i<=n; i++) 
a[i] = TRUE; 
count = 0; 


s = sqrt(n); 
for (i=2; i<=s; i++) 








if (alil) /* 已 知 i 是 一 个 素数 */ { 
count++; 
for (j=2*i; j<=n; j = jti) 


alj] = FALSE; /* i 的 倍数 都 不 是 素数 */ 





图 8-11 筛 法 选取 素数 的 代码 


8.5 基本 块 的 优化 


仅仅 通过 对 各 个 基本 块 本 身 进 行 局 部 优化 , 我 们 就 常常 可 以 实质 性 地 降低 代码 运行 所 需 的 
时 间 。 更 加 彻底 的 全 局 优化 将 从 第 9 章 开始 讨论 。 全 局 优化 将 检查 信息 是 如 何在 一 个 程序 的 多 
个 基本 块 之 间 流 动 的 。 全 局 优化 是 一 个 很 复杂 的 主题 ， 它 将 考虑 很 多 不 同 的 技术 。 
8.5.1 基本 块 的 DAG 表示 

很 多 重要 的 局 部 优化 技术 首先 把 一 个 基本 块 转换 成 为 一 个 DAG( 有 向 无 环 图 ) 。 在 6.11 节 
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H, 我 们 介绍 了 用 于 表示 简单 表达 式 的 DAG。 这 个 想法 被 自然 地 扩展 到 在 一 个 基本 块 中 创建 的 
表达 式 的 集合 。 我 们 按照 如 下 方式 为 一 个 基本 块 构 造 DAC 

1) 基本 块 中 出 现 的 每 个 变量 有 一 个 对 应 的 DAG 的 结 点 表示 其 初始 值 。 

2) 基本 块 中 的 每 个 语句 s 都 有 一 个 相关 的 结 点 N。W 的 子 结 点 是 基本 块 中 的 其 他 语句 的 对 
应 结 点 。 这 些 语句 是 在 s 之前、 最 后 一 个 对 s 所 使 用 的 某 个 运算 分 量 进行 定 值 的 语句 。9 

3) 结 点 N 的 标号 是 * 中 的 运算 符 ; 同时 还 有 一 组 变量 被 关联 到 N, 表示 s 是 在 此 基本 块 内 最 
晚 对 这 些 变量 进行 定 值 的 语句 。 

4) 某 些 结 点 被 指明 为 输出 结 点 (output node) 。 这 些 结 点 的 变量 在 基本 块 的 出 口 处 活跃 。 也 
就 是 说 , 这 些 变 量 的 值 可 能 以 后 会 在 流 图 的 另 一 个 基本 块 中 被 使 用 到 。 计 算得 到 这 些 “ 活 跃 变 
量 ” 是 全 局 数据 流 分 析 的 问题 , 将 在 9. 2.5 节 中 讨论 。 

基本 块 的 DAG 表示 使 我 们 可 以 对 基本 块 所 代表 的 代码 进行 一 些 转换 ,以 改进 代码 的 质量 。 

1) 我 们 可 以 消除 局 部 公共 子 表 达 式 (local common subexpression) 。 所 谓 公 共 子 表达 式 就 是 重 
复 计算 一 个 已 经 计算 得 到 的 值 的 指令 。 

2) 我 们 可 以 消除 死 代 码 ( dead code) , 即 计算 得 到 的 值 不 会 被 使 用 的 指令 。 

3) 我 们 可 以 对 相互 独立 的 语句 进行 重新 排序 , 这 样 的 重新 排序 可 以 降低 一 个 临时 值 需 要 保 
持 在 寄存 器 中 的 时 间 。 

4) 我 们 可 以 使 用 代数 规则 来 重新 排列 三 地 址 指令 的 运算 分 量 的 顺序 。 这 人 么 做 有 时 可 以 简化 
计算 过 程 。 

8.5.2 寻找 局 部 公共 子 表达 式 

检测 公共 子 表达 式 的 方法 是 这 样 的 。 当 一 个 新 的 结 点 民 将 被 加 入 到 DAG Pit, 我们 检查 是 
否 存在 一 个 结 点 NN, 它 和 履 具 有 同样 的 运算 符 和 子 结 点 , 且 子 结 点 顺序 相同 。 如 果 存 在 这 样 的 结 
点 , 入 计算 的 值 和 以 计算 的 值 是 一 样 的 , 因此 可 以 用 入 震 换 收 。 在 6.1.1 节 中 , 这 个 技术 被 称 为 
检测 公共 子 表达 式 的 “ 值 编码 ”方法 。 


ARAO 下 面 的 基本 块 的 DAG 见 图 8-12。 c 
cen tae bd 
c=bete 
à= ama 要 db 
当 我 们 为 第 三 个 语句 c =b + c 构造 结 点 的 时 候 , 我 们 

知道 b +c 中 的 使 用 指向 图 8-12 中 标号 为 - 的 结 点 。 因 bo c0 


为 这 个 结 点 是 b 的 最 近 的 定 值 。 因 此 , 我 们 不 会 把 语句 1 图 8-12 例 8.10 中 的 基本 块 的 DAG 
和 语句 3 所 计算 的 值 混淆 。 

然而 , 对 应 于 第 四 个 语句 a =a -a 的 结 点 的 运算 符 是 -， 且 它 的 子 结 点 是 标记 有 变量 a 和 
do 的 结 点 。 因 为 运算 符 和 子 结 点 都 和 语句 2 对 应 的 结 点 相同 , 我 们 不 需要 创建 这 个 结 点 , 而 是 
把 a 加 到 这 个 标记 为 - 的 结 点 的 定 值 变量 表 中 。 口 

因为 在 图 8-12 的 DAG 中 只 有 三 个 非 叶 子 结 点 , 看 起 来 例 8. 10 中 的 基本 块 可 以 替换 为 二 个 
只 有 三 个 语句 的 基本 块 。 实 际 上 , 假如 b 在 这 个 基本 块 的 出 口 点 不 活跃 , 我 们 不 需要 计算 变量 
b, 可 以 使 用 a 来 存放 图 8-12 中 标号 为 -的 结 点 所 代表 的 值 。 这 个 基本 块 就 变 成 了 : 





O 原文 如 此 。 如 果 * 的 某 个 运算 分 量 在 基本 块 内 没有 在 ;之 前 被 定 值 , 那么 这 个 运算 分 量 对 应 的 子 结 点 就 是 代表 该 
运算 分 量 的 初始 值 的 结 点 。 一 一 译 者 注 








an 
tou ow 


但 是 , 如 果 b 和 都 在 出 口 处 活跃 , 我 们 就 必须 使 用 第 四 个 语句 把 值 从 一 个 变量 复制 到 另 一 个 .9 
UE 当 我 们 寻找 公共 子 表达 式 的 时 候 , 我 们 实际 
上 是 寻找 不 管 如 何 计算 一 定 能 得 到 相同 结果 值 的 表达 
st, Ask, DAG 方法 不 能 看 到 下 面 的 事实 , 即 下 面 的 语 
句 序列 


a =b + C 
b=b-d 


oo. 8-13 18.11 中 的 基本 块 的 DAG 
中 , 第 二 和 第 四 个 语句 实际 上 计算 的 是 同一 个 表达 式 的 值 , 即 by + cos 也 就 是 说 , BA b A c 
在 第 二 个 和 第 四 个 语句 之 间 改 变 了 , 但 它们 的 和 仍 保持 不 变 ; 因为 b+e=(5-d)+(c+4d)。 这 
个 序列 的 DAG 见 图 8-13。 它 没有 显示 出 任何 公共 子 表达 式 。 但 是 , 如 8.5.4 节 中 将 要 讨论 的 ， 
在 DAG 中 应 用 代数 恒等式 可 以 揭示 出 这 样 的 等 值 关 系 。 Oo 
8.5.3 消除 死 代 码 

在 DAG 上 消除 死 代码 的 操作 可 以 按照 如 下 方式 实现 。 我 们 从 一 个 DAG 上 删除 所 有 没有 附 
加 活 牙 变 量 的 根 结 点 ( 即 没有 父 结 点 的 结 点 ) o 重复 应 用 这 样 的 处 理 过 程 就 可 以 从 DAG 中 消除 所 
有 对 应 于 死 代码 的 结 点 。 
DEE 如 果 图 8-13 中 的 a 和 bb 是 活路 变量 , 而 c Me 不 是 , 我 们 可 以 立刻 消除 标记 为 e 的 
根 结 点 。 然 后 标记 为 c 的 结 点 就 变 成 根 结 点 , 也 可 以 被 删除 。 标 记 为 a 和 b 的 结 点 被 保留 下 来 ， 
因为 它们 都 附 有 活路 变量。 口 
8.5.4 代数 恒等式 的 使 用 

代数 恒等式 表示 基本 块 的 另 一 类 重要 的 优化 方法 。 比 如 , 我 们 可 以 使 用 诸如 


x+0=0+%=x x-O=x 





a Seca ee aay WI=% 
这 样 的 恒等式 来 从 一 个 基本 块 中 消除 计算 步骤 。 
另 一 类 代数 优化 是 局 部 强度 消减 (reduction in strength) ， 就 是 把 一 个 代价 较 高 的 运算 蔡 换 为 
一 个 代价 较 低 的 运算 。 比 如 : 
代价 较 高 的 代价 较 低 的 


x = XX 
2X% = 多 十 区 
Xx/2 = wxO Ss 


第 三 种 相关 的 优化 是 常量 合并 ( constant folding) 。 使 用 这 种 方法 时 , 我 们 在 编译 时 刻 对 常量 
表达 式 求 值 , 并 把 此 常量 表达 式 蔡 换 为 求 出 的 值 S。 因 此 , 表达 式 2 * 3. 14 可 以 被 替换 为 6. 28。 





O 总 的 来 说 ,在 从 DAG 生成 代码 时 我 们 必须 非常 小 心地 处 理 变量 的 名 字 。 如 果 变 量 * 被 定 值 两 次 , 或 者 虽然 只 赋值 
一 次 但 初始 值 mo 被 使 用 过 , 那么 必须 保证 不 会 在 原先 存放 x 值 的 结 点 被 全 部 使 用 之 前 改变 * 的 值 。 

O 在 编译 时 刻 对 算术 表达 式 求 值 时 ,必须 使 用 和 运行 时 刻 相同 的 求 值 方法 。K Thompson 给 出 了 一 个 很 完美 的 解决 
方法 : 对 常量 表达 式 进行 编译 ,在 目标 机 上 执行 目标 代码 ， 然 后 把 表达 式 蔡 换 为 执行 结果 。 按 照 这 样 的 做 法 ， 编 
译 器 就 不 需要 另 带 一 个 解析 器 。 
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在 实践 中 , 因为 在 程序 中 频繁 使 用 符号 常量 , 所 以 会 出 现 常量 表达 式 。 

DAG 的 构造 过 程 可 以 帮助 我 们 使 用 这 些 转 换 , 以 及 其 他 的 通用 代数 转换 规则 ， 比 如 交换 律 
和 结合 律 等 。 比 如 , 假设 语言 的 参考 手册 确定 * 是 可 交换 的 , 也 就 是 说 , x ey =y x*%x。 在 创建 一 
个 标记 为 * 且 左 右 子 结 点 分 别 是 MAN 的 新 结 点 时 , 我 们 总 是 检查 这 样 的 结 点 是 否 已 经 存在 。 
然而 , 因为 * 是 可 交换 的 , 所 以 我 们 还 应 该 检查 是 否 存 在 一 个 标记 为 * 且 左 右 子 结 点 分 别 是 N 和 
MWA 

< 和 = 这 样 的 关系 运算 符 有 时 会 产生 意料 之 外 的 公共 子 表达 式 。 比 如 , 条 件 表达 式 x* > y th, 
可 以 通过 将 参数 相 减 并 测试 由 减法 运算 设置 的 条 件 代 码 来 测试 。 因 此 , 对 yx -y 和 %>y, 只 需要 
生成 一 个 DAG 结 点 人 。 

结合 律 也 可 以 用 于 揭示 公共 子 表达 式 。 比 如 ， 如 果 源 程序 中 包含 如 下 的 赋值 语句 : 


a =b es 


fe AE i Ye Sel 


WMR t 没有 在 基本 块 之 外 使 用 , 通过 应 用 + 的 交换 律 和 结合 律 , 我 们 可 以 把 这 个 序列 改 为 ， 
a= "> E 
e=atd 


编译 器 的 设计 者 应 该 仔细 阅读 语言 的 参考 手册 , 以 决定 可 以 重新 排列 哪些 计算 。 因 为 计算 
机 算术 ( 因为 上 溢 或 下 溢 等 原因 ) 可 能 不 一 定 遵守 数学 上 的 代数 恒等式 。 比 如 ， Fortran 语言 标准 
说 , 编译 器 可 以 通过 任意 数学 上 等 价 的 表达 式 来 求 值 , 前提 是 不 能 违反 原来 表达 式 的 括号 的 一 至 
性 。 因 此 ,编译 器 可 以 用 x * (y -z) 的 方式 来 计算 x*y - vee, 但 是 它 不 能 以 (ac+2) -c 的 方 
AH a+ (5-e)。 因 此 ,如 果 一 个 Fortran 编译 器 想 按照 语言 的 定义 来 优化 程序 , 它 必须 跟踪 源 
语言 表达 式 中 哪些 地 方 有 括号 。 
8. 5.5 数组 引用 的 表示 

初 看 上 去 , 数组 下 标 指令 似乎 可 以 像 其 他 的 运算 那样 处 理 。 比 如 ,考虑 下 列 的 三 地 址 指令 
序列 : 


如 果 我 们 把 a[i] 当 作 是 一 个 和 a +i 类 似 的 关于 a 和 i 的 普通 运算 ， 那么 a[i] 的 两 次 使 用 
看 起 来 好 像 是 一 个 公共 子 表达 式 。 在 这 种 情况 下 ， 我 们 可 能 会 把 第 三 个 指令 z = ali] ew 
z =X。 然而 ,因为 j 可 能 等 于 i, 中 间 的 语句 可 能 实际 上 改变 了 a[ 1] 的 值 : 因此 ,; 这 种 优化 是 
不 合法 的 。 

在 DAG F, 表示 数组 访问 的 正确 方法 如 下 。 

1) 从 一 个 数组 取 值 并 赋 给 其 他 变量 的 运算 (比如 x = al i]) 用 一 个 新 创建 的 运算 符 为 =[] 
的 结 点 表示 。 这 个 结 点 的 左右 子 结 点 分 别 代表 数组 初始 值 (本 例 中 是 ao) 和 下 标 i。 变 量 x 是 这 
个 结 点 的 标号 之 一 。 

2) 对 数组 的 赋值 (比如 aLj] = y) 用 一 个 新 创建 的 运算 符 为 [ ] = 的 结 点 来 表示 。 这 个 结 点 
的 三 个 子 结 点 分 别 表示 ao、j 和 y。 没 有 变量 用 这 个 结 点 标号 。 不 同 之 处 在 于 此 结 点 的 创建 杀 





O 然而 , 减法 运算 可 能 引起 上 溢 或 下 溢 , 而 比较 指令 不 会 引起 这 个 问题 。 
© 即 不 能 跨越 括号 求 值 一 一 译 者 注 。 
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死 了 所 有 当前 已 经 建立 的 , 其 值 依赖 于 ao 的 结 点 。 一 个 被 杀 死 的 结 点 不 可 能 再 获得 任何 标号 。 
也 就 是 说 , 它 不 可 能 成 为 一 个 公共 子 表 达 式 。 


基本 块 


的 DAG 见 图 8-14。 对 应 于 x 的 结 点 N 首先 被 创建 , 但 是 
当 标号 为 [ ] = 的 结 点 被 创建 时 ，N 就 被 杀 死 了 。 因 此 当 z 
的 结 点 被 建立 时 , 它 不 会 被 认为 和 等 同 , 而 是 必须 创建 
一 个 具有 同样 的 运算 分 量 ao 和 io 的 新 结 点 。 i Be rene 
REN 有 时 即使 某 个 结 点 的 所 有 子 结 点 都 没有 像 例 8. 13 中 的 ao 那样 的 附加 数组 变量 , 它 
也 必须 被 杀 死 。 类 伏地， 如果 一 个 结 点 具有 数组 后 代 ,即使 它 的 子 结 点 都 不 是 数组 结 点 ， 它 也 可 
以 杀 死 别 的 结 点 。 例 如 考虑 下 面 的 三 地 址 代码 


b=12+a 
x = bli] 
bljl = y 


这 里 的 情况 是 , 为 了 效率 方面 的 原因 , b 被 定 值 为 数 
组 a 中 的 一 个 位 置 。 例 如 , 如果 a 的 元 素 长 度 是 4 
AEH, 那么 b 代表 了 a 的 第 四 个 元 素 。 如果 j 和 
i 表示 同一 个 值 , 那么 bp[i] 和 b[j] 代 表 了 同一 个 
位 置 。 因 此 , 很 重要 的 一 件 事情 就 是 让 第 三 个 指令 
LS] =Y 杀 死 带 有 前 加 变量 x 的 结 点 。 然 而 , 正如。 se gg nen aes, 
我 们 在 图 8-15 中 看 到 的 ,被 杀 的 结 点 和 杀 死 被 杀 结 “个 站 点 也 可 能 东 死 对 该 数组 的 使 用 
点 的 结 点 都 把 ao 作为 孙 结 点 ， 而 不 是 子 结 点 。 口 
8.5.6 ”指针 赋值 和 过 程 调用 

当 我 们 像 下 面 的 赋值 语句 


x = *p 

ie label 
那样 , 通过 指针 进行 间接 赋值 时 , 我 们 并 不 知道 p 和 qa 指向 哪里 。 从 效果 看 , x = * p 是 对 任意 变 
量 的 使 用 , m asy 可 能 对 任意 一 个 变量 赋值 。 其 结果 是 , 运算 符 =* 必须 把 当前 所 有 带 有 附加 
标识 符 的 结 点 当 作 其 参数 。 但 是 这 么 做 会 影响 死 代码 的 消除 过 程 。 更 加 重要 的 是 ，* = 运算 符 会 
把 至 今 为 止 构 造 出 来 的 DAG 中 的 其 他 结 点 全 部 杀 死 。 

我 们 可 以 进行 一 些 全 局 指针 分 析 , 以 便 把 一 个 指针 在 代码 中 某 个 位 置 上 可 能 指向 的 变量 限 
制 在 一 个 较 小 的 子 集 内 。 即 使 是 局 部 分 析 也 可 以 限制 一 个 指针 指向 的 范围 。 比 如 , 对 于 下 面 的 
序列 

p = & 

we 
我 们 知道 是 x( 而 不 是 其 他 变量 ) 被 赋予 y 的 值 。 因 此 , 我 们 只 需要 杀 死 以 x 为 附加 变量 的 结 点 ， 
不 需要 杀 死 其 他 结 点 。 

过 程 调用 和 通过 指针 赋值 很 相似 。 在 缺乏 全 局 数据 流 信息 的 情况 下 , 我 们 必须 假设 一 个 过 
程 调用 使 用 和 改变 了 它 访问 的 所 有 数据 。 因 此 , 如 果 变 量 x 在 一 个 过 程 的 访问 范围 之 内 , 对 P 
的 调用 不 仅 使 用 了 以 x 为 附加 变量 的 结 点 , 还 杀 死 了 这 个 结 点 。 








代码 生成 347 





8. 5.7 从 DAG 到 基本 块 的 重组 

对 DAG 的 各 种 优化 处 理 可 以 在 生成 DAG 图 时 进行 ,也 可 以 在 DAG 构造 完成 后 通过 对 DAG 
的 运算 完成 。 在 完成 这 些 优化 处 理 之 后 , 我们 就 可 以 根据 优化 得 到 的 DAG 重组 生成 相应 基本 块 
的 三 地 址 代码 。 对 每 个 具有 一 个 或 多 个 附加 变量 的 结 点 , 我 们 构造 一 个 三 地 址 语句 来 计算 其 中 
某 个 变量 的 值 。 我 们 倾向 于 把 计算 得 到 的 结果 赋 给 一 个 在 基本 块 出 口 处 活路 的 变量 。 但 是 ,如 
果 我 们 没有 全 局 活跃 变量 的 信息 作为 依据 , 就 要 假设 程序 的 所 有 变量 都 在 基本 块 出 口 处 活跃 (但 
是 不 包含 编译 器 为 了 处 理 表达 式 而 生成 的 临时 变量 ) 。 

如 果 结 点 有 多 个 附加 的 活跃 变量 , 我 们 就 必须 引入 复制 语句 , 以便 给 每 一 个 变量 都 赋予 正确 
的 值 。 有 时 我 们 可 以 通过 全 局 优化 技术 ,设法 用 其 中 的 一 两 个 变量 来 准 代 其 他 变量 ,从 而 消除 这 
些 复制 语句 。 

ERED mFas- 中 的 DAG。 在 例 8.10 后 面 的 讨论 中 ,我们 确定 如 果 b 在 基本 块 的 出 
口 处 不 活跃, 那么 下 面 的 三 个 语句 


a=b+c 
d=a-d 
c=dte 


就 足以 重建 那个 基本 块 了 。 第 三 个 指令 c = a + c 必须 使 用 a 而 不 是 b 作为 运算 分 量 , 因为 经 过 
优化 的 基本 块 不 会 计算 b 的 值 。 

如 果 和 a 都 在 出 口 处 活跃 , 或 者 我 们 不 能 够 确定 它们 是 否 在 出 口 处 活路 ， 那么 我 们 还 是 需 
要 计算 a 和 bb 的 值 。 我 们 可 以 用 下 面 的 序列 来 完成 这 个 计算 : 


a=bte 
d= a= ¢ 
b=d 

e=dte 


这 个 基本 块 仍然 比 原来 的 基本 块 高 效 。 虽 然 指 令 数 目 相 同 ,， 但 我 们 已 经 把 一 个 减法 替换 为 
一 个 复制 运算 。 在 大 多 数 机 器 上 , 复制 运算 要 比 减 法 更 加 高 效 。 不 仅 如 此 , 我 们 还 有 可 能 通过 全 
局 分 析 把 此 基本 块 外 对 b 的 使 用 全 部 替换 为 对 a 的 使 用 , 从 而 消除 在 基本 块 外 对 b 的 使 用 。 在 
这 种 情况 下 , 我 们 就 可 以 再 次 回 到 这 个 基本 块 并 消除 b = 9。 直 观 地 讲 , 如 果 在 任何 使 用 b 的 这 
个 值 的 时 刻 , a 中 的 值 仍然 和 ? 一 样 ,那么 我 们 就 可 以 消除 这 个 复制 运算 。 这 种 情况 是 否 成 立 依 
赖 于 程序 如 何 重 新 计算 a 的 值 。 图 

当 从 DAG 重 构 基 本 块 时 , 我 们 不 仅 要 关心 用 哪些 变量 来 存放 DAG 中 的 结 点 的 值 , 还 要 关心 
计算 不 同 结 点 值 的 指令 的 顺序 。 应 记 住 如 下 规则 : 

1) 指令 的 顺序 必须 遵守 DAG 中 的 结 点 的 顺序 。 也 就 是 说 , 只 有 在 计算 出 一 个 结 点 的 各 个 子 
结 点 的 值 之 后 , 才 可 以 计算 这 个 结 点 的 值 。 

2) 对 数组 的 赋值 必须 跟 在 所 有 (按照 原 基本 块 中 的 指令 顺序 ) 在 它 之 前 的 对 同一 数组 的 赋值 
或 求 值 运算 之 后 。 

3) 对 数组 元 素 的 求 值 必须 跟 在 所 有 (在 原 基本 块 中 ) 在 它 之 前 的 对 同一 数组 的 赋值 指令 之 
后 。 对 同一 数组 的 两 个 求 值 运算 可 以 交换 顺序 ,只 要 在 交换 时 它们 都 没有 越过 某 个 对 同一 数组 
的 赋值 运算 即 可 。 

4) 一 个 变量 的 使 用 必须 跟 在 所 有 (在 原 基本 块 中 ) 在 它 之 前 的 过 程 调用 和 指针 间接 赋值 运算 之 后 。 

5) 任何 过 程 调用 或 者 指针 间接 赋值 都 必须 跟 在 所 有 (在 原 基本 块 中 ) 在 它 之 前 的 对 任何 变量 
的 求 值 运算 之 后 。 

也 就 是 说 ， 当 重组 代码 的 时 候 , 没有 一 个 语句 可 以 跨越 过 程 调用 或 指针 间接 赋值 运算 。 只 有 
在 两 个 使 用 同一 个 数组 的 指令 都 是 数组 访问 而 不 是 对 数组 元 素 赋值 时 , 它们 才 可 以 交换 顺序 。 
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8.5.8 8.5 节 的 练习 

练习 8.5.1; 为 下 面 的 基本 块 构造 DAG。 


d=b* ec 
e=atb 
b=b*c 
a=e-d 


练习 8.5.2: 分 别 按照 下 列 两 种 假设 简化 练习 8.5. 1 的 三 地 址 代码 。 

1) 只 有 a 在 基本 块 的 出 口 处 活跃 。 

2) a.5b、c 在 基本 块 的 出 口 处 活路 。 

练习 8.5.3: 为 图 8.9 中 的 块 B6 的 代码 构造 DAG. 请 不 要 忘记 包含 比较 指令 i<10。 

练习 8. 5.4: 为 图 8-9 中 的 块 B, 的 代码 构造 DAG。 

练习 8.5.5: 扩展 算法 8.7, 使 之 可 以 处 理 如 下 的 三 地 址 语句 (原文 为 three-statements 
者 注 ) 

{alias 

2) a = bli] 

3) a = *b 

4.) *a =b 

练习 8.5.6; 分 别 按照 下 面 的 两 个 假设 , 为 基本 块 


ali] = b 





译 


构造 DAG 图 。 假 设 如 下 : 

1) p 可 以 指向 任何 地 方 。 

2) p 只 能 指向 bp 或 a。 

1 练习 8. 5.7: 如 果 一 个 指针 或 数组 表达 式 ( 比如 a[ i] 或 者 *p) 被 赋值 之 后 又 被 使 用 , HAR 
值 和 使 用 之 间 没 有 做 任何 修改 , 我 们 就 可 以 利用 这 种 情况 来 简化 DAG。 比 如 , 在 练习 8. 5.6 的 代 
码 中 , 因为 p 可 能 指向 的 所 有 位 置 在 第 二 个 和 第 四 个 语句 之 间 没 有 被 赋值 , 所 以 不 管 p 指向 哪 
E, 语句 e = *p 都 可 以 被 替换 为 e。 = c。 请 修正 DAG 构造 算法 以 利用 这 种 情况 带 来 的 好 处 , 并 
把 你 的 算法 应 用 到 练习 8.5.6 的 代码 中 。 

练习 8. 5. 8: 假设 一 个 基本 块 由 下 面 的 C 语言 赋值 语句 生成 : 


gi a tb to 4d ti; 
Vere tt eh es 


1) 给 出 这 个 基本 块 的 三 地 址 语句 (每 个 语句 只 做 一 次 加 法 ) o 
2) 假设 x 和 y 都 在 基本 块 的 出 口 处 活跃, 利用 加 法 的 结合 律 和 交换 律 来 修改 这 个 基本 块 ， 
使 得 指令 个 数 最 少 。 


8.6 一 个 简单 的 代码 生成 器 


在 本 节 中 , 我 们 将 考虑 一 个 为 单个 基本 块 生成 代码 的 算法 。 它 依次 考虑 各 个 三 地 址 指令 , 并 
跟踪 记录 哪个 值 存放 在 哪个 寄存 器 中 。 这 样 可 以 避免 生成 不 必要 的 加 载 和 保存 指令 。 
在 代码 生成 中 的 主要 问题 之 一 是 决定 如 何 最 大 限度 地 利用 寄存 器 。 寄 存 器 有 如 下 四 种 主要 
使 用 方法 : 
。 在 大 部 分 机 器 的 体系 结构 中 , 执行 一 个 运算 时 该 运算 的 部 分 或 全 部 运算 分 量 必须 存放 在 
寄存 器 中 。 
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。 寄存 器 很 适合 做 临时 变量 , 即 在 计算 一 个 大 表达 式 时 存放 其 子 表达 式 的 值 。 或 者 更 一 般 
地 讲 , 寄存 器 适合 用 于 存放 只 在 单个 基本 块 内 使 用 的 变量 的 值 。 

。 寄存 器 用 来 存放 在 一 个 基本 块 中 计算 而 在 另 一 个 基本 块 中 使 用 的 (全 局 ) 值 。 比 如 , 循环 
下 标的 值 , 每 次 循环 都 对 该 值 作 增 量 运算 , 并 在 循环 体 中 多 次 被 使 用 。 

© 寄存 器 经 常用 来 帮助 进行 运行 时 刻 的 存储 管理 。 比 如 , 管理 运行 时 刻 栈 包 括 栈 指针 的 维 
护 ,， 栈 顶 元 素 也 可 能 被 存放 在 寄存 器 中 。 

因为 可 用 寄存 器 的 数量 是 有 限 的 , 这 些 需 求 之 间 有 相互 竞争 的 关系 。 

本 节 的 算法 假设 有 一 组 寄存 器 可 以 用 来 存放 在 基本 块 内 使 用 的 值 。 通 常情 况 下 , 这 个 寄存 
器 集合 不 包括 机 器 的 所 有 寄存 器 ,因为 有 些 寄存 器 专门 用 于 存放 全 局 变量 或 者 用 于 对 栈 进 行 管 
理 。 我 们 假设 基本 块 已 经 通过 诸如 公共 子 表达 式 合并 这 样 的 转换 而 变 成 了 我 们 希望 的 三 地 址 指 
令 序 列 。 我 们 进一步 假设 对 每 个 运算 符 有 且 只 有 一 个 对 应 的 机 器 指令 。 这 个 指令 对 存放 在 寄存 
器 中 的 所 需 的 运算 分 量 进行 运算 , 并 把 结果 存放 在 一 个 寄存 器 中 。 机 器 指令 的 形式 如 下 : 

9 LD reg, mem 

© ST mem, reg 

© OP reg, reg, reg 
8.6.1 寄存 器 和 地 址 描述 符 

我 们 的 代码 生成 算法 依次 考虑 了 各 个 三 地 址 指令 , 并 决定 需要 哪些 加 载 指令 来 把 必需 的 运 
算 分 量 加 载 进 寄 存 器 。 在 生成 加 载 指 令 之 后 , 它 开始 生成 运算 代码 。 然 后 , 如果 有 必要 把 结果 存 
放 人 一 个 内 存 位 置 , 它 还 会 生成 相应 的 保存 指 念 。 

为 了 做 出 这 些 必要 的 决定 , 我 们 需要 一 个 数据 结构 来 说 明 哪 些 程序 变量 的 值 当 前 被 存放 在 
哪个 或 哪些 寄存 器 里 面 。 我 们 还 需要 知道 当前 存放 在 一 个 给 定 变 量 的 内 存 位 置 上 的 值 是 否 就 是 
这 个 变量 的 正确 值 。 因 为 变量 的 新 值 可 能 已 经 在 寄存 器 中 计算 出 来 但 还 没有 存放 到 内 存 中 。 这 
个 数据 结构 具有 下 列 描述 符 : 

1) 每 个 可 用 的 寄存 器 都 有 一 个 寄存 器 描述 符 (register descriptor) , 它 用 来 跟踪 有 哪些 变量 的 
当前 值 存放 在 此 寄存 器 内 。 因 为 我 们 仅仅 考虑 那些 用 于 存放 一 个 基本 块 内 的 局 部 值 的 寄存 器 ， 
我 们 可 以 假设 在 开始 时 所 有 的 寄存 器 描述 符 都 是 空 的 。 随 着 代码 生成 过 程 的 进行 ; 每 个 寄存 器 
将 存放 零 个 或 多 个 变量 名 字 的 值 。 

2) 每 一 个 程序 变量 都 有 一 个 地 址 描述 符 (address descriptor) 。 它 用 来 跟踪 记录 在 哪个 或 哪些 位 
置 上 可 以 找到 该 变量 的 当前 值 。 这 个 位 置 可 以 是 一 个 寄存 器 、 一 个 内 存 地 址 、 一 个 栈 中 的 位 置 , 也 
可 以 是 由 这 些 位 置 组 成 的 一 个 集合 ; 这 个 信息 可 以 存放 在 这 个 变量 名 字 对 应 的 符号 表 条 目 中 。 
8.6.2 代码 生成 算法 

这 个 算法 的 一 个 重要 部 分 是 函数 getReg (了) 。 这 个 函数 为 每 个 与 三 地 址 指令 TT 有关 的 内 存 位 
置 选择 寄存 器 。 函 数 getReg 可 以 访问 这 个 基本 块 的 所 有 变量 对 应 的 寄存 器 和 地 址 描述 符 。 这 个 
函数 还 可 能 需要 获取 一 些 有 用 的 数据 流 信息 ,比如 哪些 变量 在 基本 块 出 口 处 活跃 。 我 们 将 首先 
给 出 基本 算法 ,然后 再 讨论 getReg 函数 。 我 们 不 知道 总 共有 多 少 个 寄存 器 可 用 于 存放 基本 块 的 
局 部 数据 , 因此 假设 有 足够 的 寄存 器 使 得 在 把 值 存放 回 内 存 , 释放 了 所 有 的 可 用 寄存 器 之 后 , 空 
闲 的 寄存 器 足以 完成 任何 三 地 址 运算 。 

在 一 个 形 如 x =y +z 的 三 地 址 指令 中 , 我 们 将 把 + 当 作 一 般 的 运算 符 , 而 ADD 当 作 等 价 的 
机 器 指令 。 因 此 , 我 们 没有 利用 + 的 交换 性 。 这 样 ， 当 我 们 实现 这 个 运算 时 , y 的 值 必须 在 ADD 
指令 中 给 出 的 第 二 个 寄存 器 中 , 而 绝 不 会 是 第 三 个 寄存 器 。 可 以 按照 下 面 的 方法 来 改进 算法 : 只 
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要 + 是 一 个 满足 交换 律 的 运算 符 , 算法 同时 为 Xx=y+z 和 x=z+Yy 生成 代码 ; 随后 再 选择 一 个 
比较 好 的 代码 序列 。 

运算 的 机 器 指令 

对 每 个 形 如 x =y+z 的 三 地 址 指令 , TERE ERR: 

1) 使 用 getReg(x=y+z) 来 为 x、y、z 选择 寄存 器 。 我 们 把 这 些 寄存 器 称 为 R、R, M Ro 

2) 如 果 ( 根 据 R, 的 寄存 器 描述 符 )y 不 在 R, 中 , 那么 生成 一 个 指令 “LD R y”, 其 中 是 
存放 y 的 内 存 位置 之 一 (y' 可 以 根据 y 的 地 址 描述 符 得 到 ) 。 

3) 类 似 地 , MERE R, A, 生成 一 个 指令 “LD R,, z”, 其 中 z' 是 存放 z 的 位 置 之 一 。 

4) 生成 指令 “ADD Ry; Ry R,” o 

复制 语句 的 机 器 指令 

形 如 * =y 的 三 地 址 指令 是 一 个 重要 的 特例 。 我 们 假设 getReg 总 是 为 * 和 y 选择 同一 个 寄存 
器 。 如 果 y 没 有 在 寄存 器 R, P, 那么 生成 机 器 指令 LD R,, yo ME y BAER, H, 我 们 不 需要 
做 任何 事情 。 我 们 只 需要 修改 R, 的 寄存 器 描述 符 , 表明 R, 中 也 存放 了 * 的 值 。 

基本 块 的 收尾 处 理 

我 们 描述 算法 时 表明 , 在 代码 结束 的 时 候 , 基本 块 中 使 用 的 变量 可 能 仅 存 放 在 某 个 寄存 器 
中 。 如 果 这 个 变量 是 一 个 只 在 基本 块 内 部 使 用 的 临时 变量 , 那 就 没有 问题 ; 当 基本 块 结束 时 , 我 
们 可 以 忘记 这 些 临时 变量 的 值 并 假设 这 些 寄 存 器 是 空 的 。 但 如 果 一 个 变量 在 基本 块 的 出 口 处 活 
BR, 或 者 我 们 不 知道 哪些 变量 在 出 口 处 活跃 , 那么 就 必须 假设 这 个 变量 的 值 会 在 以 后 被 用 到 。 在 
那 种 情况 下 , 对 于 每 个 变量 *, 如 果 它 的 地 址 描述 符 表 明 它 的 值 没有 存放 在 * 的 内 存 位 置 上 , 我 
们 必须 生成 指令 ST x, R, 其 中 情 是 在 基本 块 的 结尾 处 存放 % 值 的 寄存 器 。 

管理 寄存 器 和 地 址 描述 符 

当代 码 生 成 算法 生成 加 载 、 保 存 和 其 他 机 器 指令 时 , 它 必须 同时 更 新 寄存 器 和 地 址 描述 符 。 
修改 的 规则 如 下 : 

1) 对 于 指令 “LD R, x”: 

D 修改 寄存 器 的 寄存 器 描述 符 , 使 之 只 包含 x。 

D 修改 x 的 地 址 描述 符 , 把 寄存 器 尺 作为 新 增 位 置 加 入 到 * 的 位 置 集合 中 。 

© 从 任何 不 同 于 7 的 变量 的 地 址 描述 符 中 删除 Ro (原文 缺 一 条 一 一 译 者 注 。) 

2) 对 于 指令 ST x, R, 修改 x 的 地 址 描述 符 , 使 之 包含 自己 的 内 存 位 置 。 

3) 对 于 实现 三 地 址 指令 x=y+z 的 “ADD R,, R,, R,” 这 样 的 运算 而 言 : 

D 改变 ,的 寄存 器 描述 符 , 使 之 只 包含 xo 

D 改变 x 的 地 址 描述 符 使 得 它 只 包含 位 置 Rs。 注意 , 现在 * 的 地 址 描述 符 中 不 包含 * 的 内 
存 位 置 。 

© 从 任何 不 同 于 x 的 变量 的 地 址 描述 符 中 删除 Rs 

4) 当 我 们 处 理 复制 语句 x =y 时 ,如 果 有 必要 生成 把 y MRAR, 的 加 载 指 令 , 那么 在 生成 加 
载 指令 并 (按照 规则 1) 像 处 理 所 有 的 加 载 指令 那样 处 理 完 各 个 描述 符 之 后 , 再 进行 下 面 的 处 理 : 

O 把 x 加 入 到 RR, 的 寄存 器 描述 符 中 。 

O 修改 x 的 地 址 描述 符 , 使 得 它 只 包含 唯一 的 位 置 R,。 
DEG 让 我 们 把 由 下 列 三 地 址 语句 组 成 的 基本 块 翻译 成 代码 。 


Ap sE A 
hell i, 
<< acp p 
+ 
e 
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这 里 , 我 们 假设 t、u、v 都 是 基本 块 的 局 部 临时 变量 ， 而 变量 a、b、c、 a 在 基本 块 出 口 处 活跃。 
因为 我 们 还 没有 讨论 函数 getReg 是 如 何 工 作 的 ,所 以 将 简单 地 假设 当 需 要 时 总 有 足够 的 寄存 器 
可 用 。 但 是 当 一 个 寄存 器 中 存放 的 值 不 再 有 用 时 ( 比如, 它 只 存放 了 一 个 临时 变量 的 值 ， 上 且 对 这 
个 临时 变量 的 所 有 使 用 都 已 经 处 理 完了 ) , 我 们 就 复 用 这 个 寄存 器 。 

图 8-16 显示 了 算法 生成 的 所 有 机 器 代码 指令 。 该 图 还 显示 了 在 翻译 每 个 三 地 址 指令 之 前 和 
之 后 的 寄存 器 和 地 址 描述 符 的 情况 。 
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exit 
ST a, R2 
ST d, R1 
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图 8-16 生成 的 指令 以 及 寄存 器 和 地 址 描述 符 的 改变 过 程 


因为 最 初 寄存 器 中 不 保存 任何 值 , 我 们 需要 为 第 二 个 三 地 址 指令 上 Eap 生成 三 个 指令 。 
因此 , 我 们 看 到 a 和 b 被 加 载 到 寄存 器 R1 和 R2 中 , 而 t 的 值 生成 后 存放 于 寄存 器 R FE 
意 , 我 们 可 以 使 用 R2 来 存放 上 是 因为 原先 存放 于 R2 中 的 也 的 值 在 该 基本 块 内 不 再 被 使 用 。 因 
为 预 设 了 b 在 基本 块 的 出 口 处 活跃 , 假如 (b 的 地 址 描述 符 表明 )b 不 在 它 自己 的 内 存 位 置 上 , 那 
么 我 们 将 不 得 不 先 把 R 中 的 值 保存 到 b。 假 如 我 们 需要 R, 那么 生成 指令 ST b R2 的 决定 将 由 
getReg 做 出 。 

第 二 个 指令 u =a -c 不 需要 加 载 a WHS, 因为 a 已 经 存放 在 寄存 器 R1 中 | 原来 存放 在 
寄存 带 RL 中 的 a 的 值 在 该 基本 块 中 不 再 被 用 到 ， 而 且 如 果 在 基本 块 之 外 需要 使 用 a 的 值 , 可 以 
a 的 内 存 位 置 上 获取 (因为 a 的 值 也 在 它 自己 的 内 存 位置 上 )。 因 此 ， 我 们 还 可 以 复 用 R1 KE 
放 结果 u。 请 注意 , 我 们 改变 了 a 的 地 址 描述 符 , 以 表明 它 已 经 不 在 RI H, 但 是 还 在 称 为 a 的 
内 存 位 置 中 。 

第 三 个 指令 v =t +u 只 需要 一 个 加 法 指令 。 而 且 , 我 们 可 以 用 R 来 存放 结果 v, 因为 原先 
存放 在 该 寄存 器 中 的 c 的 值 在 该 基本 块 内 不 再 使 用 , E c 在 自己 的 内 存 位 置 上 也 存放 了 这 个 值 。 

复制 指令 a = a 需要 一 个 指令 来 加 载 a, 因为 a 不 在 寄存 器 中 。 图 中 显示 寄存 器 R2 的 描述 
符 包 含 了 a 和 b。 把 a 加 入 到 寄存 器 描述 符 是 我 们 处 理 这 个 复制 语 铝 的 结果 ， 而 不 是 任何 机 器 指 
令 的 结果 。 
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第 五 个 指令 av +u 使 用 两 个 存放 在 寄存 器 中 的 值 。 因 为 是 一 个 临时 变量 且 它 的 值 不 百 
波 使 用 ， 所 以 我 们 选择 复 用 它 的 寄存 器 RL 来 存放 的 新 值 。 请 注意 ，q 现在 只 存放 在 Rl 中 ,不 
在 它 自己 的 内 存 位 置 上 。 对 于 a 也 是 同样 的 情况 ,a 的 值 只 存放 在 R2 中 ， 而 不 在 被 称 为 = 的 中 
存 位 置 上 。 因 为 这 个 原因 ,我 们 需要 为 基本 块 的 机 器 代码 增加 一 个 “尾声 ”: EAA HT AE 
的 变量 & 和 忆 的 值 保存 回 它们 的 内 存 位 置 。 这 就 是 图 中 的 最 后 两 个 指令 的 工作 。 回 
8.6.3 函数 getReg 的 设计 

最 后 ,让 我 们 考 刀 如 何 针对 一 个 三 地 址 指令 /实现 函数 getReg (1) 。 实 现 这 个 函数 可 以 选择 
很 多 种 方法 ,当然 也 存在 一 些 绝对 不 可 以 选择 的 方法 。 这 些 错误 方法 会 因 丢 失 一 个 或 多 个 活 工 
恋 量 的 值 而 导致 生 成 错误 代码 。 我 们 用 处 理 一 个 运算 指令 的 步骤 来 开始 我 们 的 讨论 , 还 是 用 * = 
yee 作为 一 般 性 的 例子 。 首 先 , 我 们 必须 为 和 = 分 别 选 择 一 个 寄存 器 。 这 两 次 选择 所 面临 四 中 
题 是 相同 的 , 因此 我 们 将 集中 考虑 为 y 选择 寄存 器 R, 的 方法 。 选择 规则 如 下 : 

D 如 果 当前 就 在 一 个 寄存 器 中 , 则 选择 一 个 已 经 包含 了 7 的 寄存 器 作为 R,。 不 需要 生成 
一 个 机 器 指令 来 把 y 加 载 到 这 个 寄存 器 。 

2) 如 果 y 不 在 寄存 器 中 , 但 是 当前 存在 一 个 空 寄存 器 ， 那么 选择 这 个 空 寄存 器 作为 ii。 

3) 比较 困难 的 情况 是 不 在 寄存 器 中 且 当前 也 没有 空 寄存 器 。 无 论 如 何 , 我 们 需要 选择 一 
个 可 行 的 寄存 器 ,并 且 必 须 保证 复 用 这 个 寄存 器 是 安全 的 。 设 R 是 一 个 候选 寄存 器 , 且 假设 " 是 
RR 的 寄存 器 描述 符 表明 的 已 位 于 R 中 的 变量 。 我 们 需要 保证 要 么 。 的 值 已 经 不 会 被 再 次 使 用 , 2 
么 我 们 还 可 以 到 别 的 地 方 获取 w 的 值 。 可 能 的 情况 包括 : 

D 如 果 ，* 的 地 址 描述 符 说 4 还 保存 在 了 之 外 的 其 他 地 方 , 我 们 就 完成 了 任务 。 

© 如 果 v 是 x, 即 由 指令 1 计算 的 变量 , 且 * 不 同时 是 指令 了 的 运算 分 量 之 一 ( 比如 这 个 例子 
中 的 z) ,那么 我 们 就 完成 了 任务 。 其 原因 是 在 这 种 情况 下 , 我 们 知道 的 当前 值 决 不 会 再 次 被 使 
用 , 因此 我 们 可 以 忽略 它 。 

@ 否则 , 如 果 , 不 会 在 此 之 后 被 使 用 ( 即 在 指令 7 之 后 不 会 再 次 使 用 v, 且 如 果 ， 在 基本 块 的 
出 口 处 活跃 , 那么 w 的 值 必然 在 基本 块 中 被 重新 计算 )， 那么 我 们 就 完成 了 任务 。 

D 如 果 前 面 的 三 个 条 件 都 不 满足 ， 我们 就 需要 生成 保存 指令 ST v, 来 把 ?的 值 复制 到 它 晶 
已 的 内 存 位 置 上 去 。 这 个 操作 称 为 溢出 操作 (spil) 。 

因为 在 那个 时 刻 及 可 能 存放 了 多 个 变量 的 值 , 所 以 我 们 需要 对 每 个 这 样 的 变量 "重复 上 述 步 
R. BE, 及 的 “得 分 "是 我 们 需要 生成 的 保存 指令 的 个 数 。 选 择 一 个 具有 最 低 得 分 的 寄存 器 (或 
Rts 

现在 考虑 寄存 器 R, 的 选择 。 其 中 的 难点 和 可 选项 几乎 和 选择 R, 时 的 一 样 , 因此 我 们 只 给 
出 其 中 的 区 别 。 

1) 因为 4 的 一 个 新 值 正在 被 计算 , 因此 只 存放 了 x 的 值 的 寄存 器 对 Rs 来 说 总 是 可 接受 。 即 
使 * 就 是 y 或 z 之 一 ; 这 个 语句 仍然 成 立 ， 因 为 我 们 的 机 器 指令 允许 一 个 指令 中 的 两 个 寄存 器 
相同 。 

2) 如 果 ( 像 上 面 对 变 量 ， 的 描述 那样 )y 在 指令 了 之 后 不 再 使 用 , 且 ( 在 必要 时 加 载 y 之 后 ) 
R, 仅仅 保存 了 Y 的 值 , ABA R, 同时 也 可 以 用 作 R,. Sb 2 AR, 也 有 类 似 选择 。 

需要 特别 考虑 的 最 后 一 个 问题 是 当 7 是 复制 指令 x=y 时 的 情况 。 我 们 用 上 面 描述 的 方法 选 
HER; 然后 是 让 Ri =Ry。 

8.6.4 8.6 节 的 练习 
练习 8.6.1: 为 下 面 的 每 个 C 语 言 赋值 语句 生成 三 地 址 代码 
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13 x = a + bc; 

2) x = a/(btc) - d*(e+f); 

3) x = ali] + 1; 

4) ali] = b[lc[i]]; 

5) alitii blil lk) + ole lly 

6) xptt = *q++; 
假设 其 中 的 所 有 数组 元 素 都 是 整数 , 每 个 元 素 占 四 个 字 节 。 在 4 和 5 部 分 , 假设 a、b、c 是 常数 。 
和 在 本 章 之 前 有 关 数 组 访问 的 例子 中 一 样 , 它们 给 出 了 同名 数组 的 第 0 个 元 素 的 位 置 。 

| 练习 8. 6.2: 假设 数组 a、b、c 分 别 通过 指针 pa, pb 和 pc 定位 。 这 些 指针 指向 各 自 数 组 
的 首 元 素 ( 第 0 个 元 素 )。 重 复 练习 8.6.1 的 4 和 5 部 分 。 

练习 8. 6.3; 把 在 练习 8. 6. 1 中 得 到 的 三 地 址 代码 转换 为 本 节 给 出 的 机 器 模型 的 机 器 代码 。 
假设 你 有 任意 多 个 寄存 器 可 用 。 

练习 8. 6. 4: 假设 有 三 个 可 用 的 寄存 器 , 使 用 本 节 中 的 简单 代码 生成 算法 , 把 在 练习 8. 6.1 
中 得 到 的 三 地 址 代码 转换 为 机 器 代码 。 请 给 出 每 一 个 步 又 之 后 的 寄存 器 和 地 址 描述 符 。 

练习 8. 6.5; 重复 练习 8.6.4, 但 是 假设 只 有 两 个 可 用 的 寄存 器 。 


8.7 MALT 


虽然 大 部 分 编译 器 产品 通过 和 仔细 的 指令 选择 和 寄存 器 分 配 来 生成 优质 代码 , 但 还 有 一 些 编 
译 器 使 用 另 一 种 策略 : 它们 先生 成 原始 的 代码 , 然后 对 目标 代码 进行 “优化 ”转换 , 提高 目标 代码 
的 质量 。 这 里 使 用 术语 “优化 ”具有 一 定 的 误导 性 , 因为 不 能 保证 得 到 的 代码 在 任何 数学 度量 之 
下 都 是 最 优 的 。 不 管 怎么 说 , 很 多 简单 的 转换 可 以 有 效 地 改善 目标 程序 的 运行 时 间 和 空间 需求 。 

一 个 简单 却 有 效 的 、 用 于 局 部 改进 目标 代码 的 技术 是 宇 孔 优化 (peephole optimization) 。 它 在 
优化 的 时 候 检查 目标 指令 的 一 个 滑动 窗口 ( 即 宇 孔 ) ,并且 只 要 有 可 能 就 在 宇 孔 内 用 更 快 或 更 短 
的 指令 来 替换 窗口 中 的 指令 序列 。 也 可 以 在 中 间 代 码 生成 之 后 直接 应 用 窥 孔 优化 来 提高 中 间 表 
示 形 式 的 质量 。 

窥 孔 是 程序 上 的 一 个 小 的 滑动 窗口 。 窥 孔 优化 技术 并 不 要 求 在 窥 孔 中 的 代码 一 定 是 连续 的 ， 
尽管 有 些 实现 要 求 代码 连续 。 窥 孔 优化 的 特点 是 每 一 次 改进 又 可 能 产生 出 新 的 优化 机 会 。 一 般 
来 说 , 为 了 获得 最 大 的 好 处 就 需要 多 次 扫描 目标 代码 。 在 本 节 中 , 我 们 将 给 出 下 列 具 有 将 孔 优 化 
特点 的 程序 变换 的 例子 。 

。 TRS IA 

。 控制 流 优化 

e 代数 化 简 

。 机 器 特有 指令 的 使 用 
8.7.1 消除 元 余 的 加 载 和 保存 指令 

如 果 我 们 在 目标 程序 中 看 到 指令 序列 


LD RO, a 
ST a, RO 


我 们 就 可 以 删除 其 中 的 保存 指令 , 因为 不 管 这 个 保存 指令 何 时 执行 , 第 一 个 指令 将 保证 a 的 值 已 
经 被 加 载 到 寄存 器 RO 中 。 请 注意 , 假如 保存 指令 有 一 个 标号 , 我 们 就 不 能 保证 第 一 个 指令 总 是 
在 第 二 个 指令 之 前 执行 ,因此 不 能 删除 这 个 保存 指令 。 换 名 话说, 为 了 保证 这 样 的 转换 是 安全 
的 , 这 两 个 指令 必须 在 同一 个 基本 块 内 。 

这 种 类 型 的 元 余 加 载 / 保 存 指令 不 会 由 前 一 节 中 的 简单 代码 生成 算法 生成 。 但是, 一 个 类 似 
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于 8. 1.3 节 中 的 原始 的 代码 生成 器 可 能 生成 类 似 的 元 余 代 码 序列 。 
8.7.2 消除 不 可 达 代 码 

BAARN SHE TAS — TRE EAE a ee 
令 可 以 被 删除 。 通 过 重复 这 个 运算 ,就 可 以 删除 一 个 指令 序列 。 比 如 ,为 了 调试 的 目的 , 一 个 大 
型 程序 中 可 能 含有 一 些 只 有 当 变量 debug 等 于 1 时 才 运 行 的 代码 片断 。 在 中 间 表 示 形 式 中 , 这 
个 代码 看 起 来 可 能 就 像 


if debug == 1 goto Li 
goto L2 
Li: print debugging information 
L2: 


一 个 显而易见 的 窥 孔 优化 方法 是 消除 级 联 跳 转 指令 。 因 此 , A debug 的 值 是 什么 , 上面 
的 代码 序列 可 以 被 替换 为 : 


if debug != 1 goto L2 
print debugging information 
L2: 


如 果 debug 在 程序 开始 的 时 候 被 设置 为 0, 常量 传播 优化 将 把 这 个 序列 转换 为 


if 0 != 1 goto L2 
print debugging information 
L2: 


现在 , 第 一 个 语句 的 条 件 值 总 是 true, 因此 这 个 语句 可 以 被 替换 为 goto L2 。 bcm ea 
打印 调试 信息 的 所 有 语句 都 变 成 了 不 可 达 语 句 , 因此 可 以 被 逐一 消除 。 
8.7.3 控制 流 优化 
简单 的 中 间 代 码 生 成 算法 经 常生 成 目标 为 无 条 件 跳 转 指令 的 无 条 件 跳 转 指令 , 到 达 条 件 跳 
转 指 令 的 无 条 件 跳 转 指令 , 或 者 到 达 无 条 件 跳 转 指令 的 条 件 跳 转 指 令 。 这 些 不 必要 的 跳 转 指令 
可 以 通过 下 面 几 种 窥 孔 优化 技术 从 中 间 代 码 或 者 目标 代码 中 消除 。 我 们 可 以 把 序列 
aote ti 
L1: goto L2 
替换 为 
goto L2 
Li: goto L2 
如 果 没 有 跳 转 到 LI 的 指令 , IF AIBA) LL: goto L2 之 前 是 一 个 无 条 件 跳 转 指令 , 所 以 可 以 
消除 这 个 语句 。 
类 似 地 , 序列 
if a < b goto Li 
L1: wate L2 
可 以 被 苦 换 为 序列 
if a < b goto L2 
Li: woes L2 
最 后 , 假设 只 有 一 个 到 达 L1 的 跳 转 指令 , H L1 之 前 是 一 个 无 条 件 跳 转 指令 , 那么 序列 


goto L1 


Li: if a < b goto L2 
L3: 


可 以 被 蔡 换 为 序列 
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if a < b goto L2 
goto L3 


L3: 

虽然 两 个 序列 中 的 指令 个 数 相同 , 但 是 在 第 二 个 序列 中 我 们 有 时 可 以 跳 过 无 条 件 跳 转 指令 ， 
而 在 第 一 个 序列 中 却 不 可 能 。 因 此 , 第 二 个 序列 的 运行 时 间 要 优 于 第 一 个 序列 的 运行 时 间 。 
8.7.4 ”代数 化 简 和 强度 消减 

在 8.5 节 , 我 们 讨论 了 可 以 用 于 简化 DAC 的 代数 恒等式 。 这 些 代 数 恒等式 也 可 以 被 罕 孔 优 


化 器 用 于 消除 窥 孔 中 类 似 于 


x=x+0 


或 者 


xxi] 
的 三 地 址 语句 。 

类 似 地 , 强度 消减 转换 也 可 以 应 用 到 窗 孔 中 , 把 代价 比较 高 的 运算 替换 为 目标 机 右上 代价 较 
低 的 等 价 运 算 。 有 些 机 器 指令 和 另 一 些 指令 相 比 其 代价 要 低 很 多 , 它们 经 常 被 当 作 相 应 的 高 代 
价 运算 的 特殊 情况 来 使 用 。 比 如 , 用 x*% 实现 x? 的 代价 总 是 比 通过 调用 求 振 函数 实现 a 的 代 
价 要 低 。 对 于 乘 数 (除数 ) 为 2 的 宕 的 定点 数 乘法 (除法 ) ,用 移 位 运算 实现 的 代价 要 低 一 些 。 除 
数 为 常数 的 浮 点 除法 可 以 通过 乘 数 为 该 常量 倒数 的 乘法 来 求 近似 值 。 后 一 种 做 法 的 代价 要 小 
一 点 。 
8.7.5 使 用 机 器 特有 的 指令 

目标 机 可 能 会 有 一 些 能 够 高 效 实现 某 些 特定 运算 的 硬件 指令 。 检 测 允 许 使 用 这 些 指 令 的 情 
况 可 以 显著 地 降低 运行 时 间 。 比 如 , 有些 机 器 具有 自动 增 量 和 自动 减 量 的 寻 址 模式 。 这 些 指令 
在 使 用 一 个 运算 分 量 的 值 之 前 或 之 后 , 将 运算 分 量 的 值 自动 加 一 或 减 一 。 在 参数 传递 时 的 压 栈 
或 出 栈 运算 中 使 用 这 个 模式 可 以 大 大 提高 代码 的 质量 。 这 个 模式 也 可 以 在 类 似 于 x =x+1 的 语 
句 的 代码 中 使 用 。 
8.7.6 8.7 节 的 练习 

练习 8.7.1; 构造 一 个 算法 ， 它 可 以 在 目标 机 器 代码 上 的 滑动 宕 孔 中 进行 元 余 指令 消除 。 

练习 8. 7. 2: 构造 一 个 算法 ， 它 可 以 在 目标 机 器 代码 上 的 滑动 窥 孔 中 进行 控制 流 优化 。 

练习 8.7. 3: 构造 一 个 算法 , 它 可 以 在 目标 机 器 代码 上 的 滑动 窥 孔 中 进行 简单 的 代数 简化 和 
强度 消减 。 


8.8 寄存 器 分 配 和 指派 


只 涉及 寄存 器 运算 分 量 的 指令 要 比 那 些 涉及 内 存 运 算 分 量 的 指令 运行 得 快 。 在 现代 的 机 器 
E, 处 理 器 速度 要 比 内 存 速度 快 一 个 数量 级 以 上 。 因 此 , 寄存 器 的 有 效 利用 对 生成 优质 代码 是 非 
常 重要 的 。 本 节 将 给 出 不 同 的 策略 , 用 于 确定 在 程序 的 每 个 点 上 , 哪个 值 应 该 存放 在 寄存 器 中 
(寄存 器 分 配 ) 以 及 各 个 值 应 该 存放 在 哪个 寄存 器 中 (寄存 器 指派 ) 。 

寄存 器 分 配 和 指派 的 方法 之 一 是 把 目标 程序 中 的 特定 值 分 配给 特定 的 寄存 器 。 比 如 , 我 们 
可 以 确定 把 基地 址 指派 给 一 组 寄存 器 , 算术 计算 则 使 用 另 一 组 寄存 器 ,， 栈 顶 指针 指派 给 一 个 固定 
的 寄存 器 ,等 等 。 

这 个 方法 的 优点 是 使 代码 生成 器 的 设计 变 得 简单 。 但 因为 它 的 应 用 有 太 多 限制 , 所 以 寄存 
器 的 使 用 效率 较 低 : 有 些 被 占用 的 寄存 器 在 相当 数量 的 代码 运行 中 没有 被 使 用 到 , 同时 却 不 得 不 
生成 很 多 不 必要 的 其 他 寄存 器 的 加 载 和 保存 运算 指令 。 虽 然 如 此 , 在 大 多 数 计算 环境 中 还 是 要 
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保留 一 些 寄存 器 。 这 些 被 保留 的 寄存 器 可 以 被 用 作 基 址 寄存 器 、 栈 顶 指针 寄存 器 或 其 他 类 似 的 
用 途 。 其 他 寄存 器 则 由 代码 生成 器 在 它 认 为 适当 的 时 候 使 用 。 
8.8.1 全 局 寄存 器 分 配 

8.6 节 中 的 代码 生成 算法 在 单个 基本 块 的 运行 期 间 使 用 寄存 器 来 存放 值 。 但 是 , 在 每 个 基本 
块 的 结尾 处 , 所 有 活跃 变量 的 值 都 被 保存 到 内 存 中 。 为 了 省 略 一 部 分 这 样 的 保存 及 相应 的 加 载 
指令 , 我 们 可 以 把 一 些 寄存 器 指派 给 频繁 使 用 的 变量 , 并且 使 得 这 些 寄 存 器 在 不 同 基本 块 中 的 
《 即 全 局 的 ) 指 派 保持 一 致 。 因 为 程序 的 大 部 分 时 间 花 在 它 的 内 部 循环 上 , 所 以 一 个 自然 的 全 局 
寄存 器 指派 方法 是 试图 在 整个 循环 中 把 频繁 使 用 的 值 存 放 在 固定 的 寄存 器 中 。 从 现在 开始 , 假 
设 我 们 知道 一 个 流 图 的 循环 结构 , 并 且 我 们 知道 在 一 个 基本 块 中 计算 的 哪些 值 会 在 该 基本 块 外 
使 用 。 下 一 个 章 将 介绍 用 于 计算 这 些 信息 的 技术 。 

全 局 寄存 融 分 配 的 策略 之 一 是 分 配 固定 多 个 寄存 器 来 存放 每 个 内 部 循环 中 最 活路 的 值 。 在 
不 同 的 循环 中 所 选择 的 值 也 有 所 不 同 。 没 有 被 分 配 的 寄存 器 可 以 如 8.6 节 中 说 的 那样 用 于 存放 
一 个 基本 块 的 局 部 值 。 这 个 方法 的 缺点 是 固定 的 寄存 器 个 数 并 不 总 是 恰好 等 于 用 于 全 局 寄存 器 
分 配 的 最 佳 数量 。 但 是 这 个 方法 实现 起 来 很 简单 , 它 曾 经 被 用 在 Fortran H 中 。 这 是 IBM 在 20 世 
纪 60 年 代 后 期 为 360 系列 计算 机 开发 的 Fortran 优化 编译 器 。 

在 早期 的 C 编译 器 中 , 程序 员 可 以 明确 地 参与 某 些 寄存 器 分 配 过 程 。 他 们 使 用 寄存 器 声明 
来 使 得 某 些 值 在 一 个 过 程 运行 期 间 都 保存 在 寄存 器 中 。 明 智 地 使 用 寄存 器 声明 确实 可 以 提高 很 
多 程序 的 运行 速度 , 但 是 应 该 鼓励 程序 员 在 分 配 寄存 器 之 前 先 获取 程序 的 运行 时 刻 特征 并 确定 
程序 运行 的 热点 代码 。 

8.8.2 使 用 计数 

通过 在 循环 上 运行 时 把 一 个 变量 x 保存 在 寄存 器 里 面 , 我 们 可 以 节省 从 内 存 中 加 载 x 的 开 
Ho 在 本 节 我 们 假设 ; 如果 把 x 分 配 在 寄存 器 中 , 对 % 的 每 一 次 引用 可 以 节省 一 个 单位 的 (用 于 
加 载 的 ) 成 本 。 然 而 , WR x 在 一 个 基本 块 中 被 计算 之 后 又 在 同一 个 基本 块 中 被 使 用 , 那么 当 使 
用 8.6 闻 中 的 算法 来 生成 基本 块 代码 时 , x 有 很 大 的 机 会 被 仍然 保存 在 寄存 器 中 。( 因 此 对 x 的 
使 用 很 可 能 本 来 就 不 需要 从 内 存 中 加 载 。 译 者 注 ) 因 此 , RAH x 在 循环 工 的 某 个 基本 块 内 
被 使 用 , 且 在 同一 基本 块 中 * 没有 被 先行 赋值 时 , 我 们 才 认 为 这 次 使 用 节约 了 一 个 单位 的 开销 。 
如 果 我 们 能 够 避免 在 某 个 基本 块 的 结尾 把 * 保存 回 内 存 , 我 们 也 可 以 省 略 2 个 单位 的 开销 : 保存 
指令 和 之 后 的 加 载 指令 。 因 此 , 如 果 * 被 分 配 在 某 个 寄存 器 中 , 对 于 每 个 向 赋值 且 x 在 其 出 口 
处 活路 的 基本 块 , 我 们 节省 了 两 个 单位 的 开销 。 

在 支出 方面 , 如 果 % 在 循环 头 部 的 入 口 处 活跃 , 我 们 必须 在 进入 循环 工 之 前 把 x 加载 到 它 的 
寄存 器 中 。 这 个 加 载 的 成 本 是 两 个 成 本 单元 。 类 亿 地 ， 对 于 循环 三 的 每 个 出 口 基本 块 B, MR x 
在 召 的 某 个 工 之 外 的 后 继 的 人口 处 活路 , 我 们 必须 以 2 个 单位 的 代价 把 * 保存 起 来 。 然 而 , 假设 
循环 将 迭代 多 次 , 我 们 可 以 忽略 这 些 支出 。 因 为 每 次 进入 循环 时 , 这 些 指令 只 会 运行 一 次 。 因 
此 , 在 循环 L 中 把 一 个 寄存 器 分 配给 x 所 得 到 的 好 处 的 一 个 估算 公式 是 


> use(x,B) +2 * live(x,B) (8.1) 
Lehi Sasa 

其 中 , use(x, 8) 是 x 在 B 中 被 定 值 之 前 被 使 用 的 次 数 。 如 果 % 在 B 的 出 口 处 活路 并 在 B 中 被 赋 
予 一 个 值 , W live(x, 8B) 的 取 值 为 1, 否则 live(x, B) 为 0。 请 注意 , 式 8. 1 只 是 一 个 估算 公式 这 
是 因为 一 个 循环 中 的 各 基本 块 的 运行 频率 实际 是 不 同 的 , 也 因为 式 (8.1) 是 基于 循环 被 多 次 迭代 
的 假设 之 上 的 。 因 此 在 特定 的 机 器 上 , 有 可 能 需要 设计 二 个 与 式 (8.1) 类 似 , 但 具有 二 定 差异 的 
AA 
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考虑 图 8-17 中 所 示 的 内 部 循环 中 的 基本 块 。 图 中 的 跳 转 指令 和 条 件 跳 转 指令 都 被 省 


略 了 。 假 设 寄存 器 RO、R1 MR 用 于 存 
放 整 个 循环 范围 内 的 值 。 为 方便 起 见 , 在 
图 8-17 中 , 各 个 基本 块 的 入 口 处 /出 口 处 
的 活跃 变量 分 别 显示 在 基本 块 的 上 方 和 下 
方 。 我 们 将 在 下 一 章 中 讨论 关于 活跃 变量 
的 复杂 问题 。 比 如 , 请 注意 e M EAE B 
的 结尾 处 活跃 , 但 是 只 有 e 在 Bs WAHO 
处 活跃 ; RÄ fE B 的 入 口 处 活跃 。 一 
般 来 说 , 在 一 个 基本 块 的 结尾 处 活跃 的 变 
量 集 合 是 那些 在 该 基本 块 的 后 继 基本 块 的 
入 日 处 活跃 的 变量 的 并 和 集 。 

AIHA n-a HRS, DENE; R 
们 观察 到 a 在 B 的 出 口 处 活跃 且 在 Bi 中 





b, c,d, e, f EK 


图 8-17 一 个 内 层 循 环 的 流 图 


被 赋值 , 但 是 它 不 在 Ba By, By 的 出 口 处 活跃 。 因 此 ， 忆 pu Axise(a;B) = 2。 当 =a 时 ， 
式 (8.1) 的 值 是 4。 也 就 是 说 , 如 果 选 择 某 个 全 局 寄存 器 来 存放 a 的 值 ,可 以 节约 的 4 个 成 本 音 
fii. Atb, c,d, eE, 式 (8:1) 的 值 分 别 是 5、3、6、4 和 4。 因 此 , 我们 可 以 为 R0、RL、R2 分 
别 选择 ap、a。 把 RO 用 于 存放 或 三 是 另 一 种 选择 ,显然 这 样 做 具有 同样 的 收益 。 假设 8.6 
节 中 介绍 的 策略 用 于 生成 各 个 基本 块 的 代码 , 图 8-18 显示 了 根据 图 8-17 生成 的 汇编 代码 。 在 图 
8-17 中 , 我 们 没有 为 略 去 的 各 个 基本 块 结尾 处 的 条 件 或 无 条 件 跳 转 指令 生成 代码 ,因此 我 们 没有 


像 通 常 那样 把 代码 显示 成 为 一 个 序列 。 








LD R3. € 
ADD R1, R2, 


回 


图 8-18 使 用 全 局 寄存 器 指派 的 代码 序列 
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8.8.3 外 层 循环 的 寄存 器 指派 

在 为 内 层 循 环 指派 寄存 器 并 生成 代码 之 后 , 我 们 可 以 把 同样 的 想法 应 用 到 更 大 的 外 围 循环 
上 去 。 如 果 一 个 外 层 循 环 厂 包含 一 个 内 层 循环 L, 在 五 中 分 配 的 寄存 器 的 名 字 不 一 定 要 在 六 
-L 部 分 也 分 配 到 一 个 寄存 器 。 然 而 , 如 果 我 们 决定 在 L 中 人 而 不 是 在 中) 为 x 分 配 一 个 寄 
ER, 我 们 必须 在 的 入 口 处 加 载 x, ME Ly 的 出 口 处 保存 x。 我 们 把 在 外 层 循环 L 中 选择 为 哪 
些 名 字 分 配 寄存 器 的 标准 留 作 练 习 , 在 选择 时 假设 已 经 为 所 有 骨 套 在 五 内 部 的 循环 完成 了 名 字 
选择 。 

8. 8.4 通过 图 着 色 方 法 进行 寄存 器 分 配 

当 计算 中 需要 一 个 寄存 器 , 但 所 有 可 用 寄存 器 都 在 使 用 时 ， 某 个 正 被 使 用 的 寄存 器 的 内 容 必 
须 被 保存 ( 溢出 ) 到 一 个 内 存 位 置 上 ， 以 便 释放 出 一 个 寄存 器 。 图 着 色 方法 是 一 个 可 用 于 分 配 寄 
存 器 和 管理 寄存 器 溢出 的 简单 且 系 统 化 的 技术 。 

这 个 方法 需要 进行 两 趟 处 理 。 在 第 一 趟 处 理 中 选择 目标 机 器 指令 ， 处 理 时 假设 有 无 穷 多 个 
符号 化 寄存 器 。 经 过 这 次 处 理 , 中 间 代 码 中 使 用 的 名 字 变 成 了 寄存 器 的 名 字 , 而 三 地 址 指令 变 成 
了 机 器 指令 。 如 果 对 变量 的 访问 要 求 一 些 指 令 使 用 栈 指针 、 显 示 表 指针 、 基 址 寄存 器 或 其 他 的 量 
来 辅助 访问 , 我 们 就 假设 这 些 量 存放 在 那些 为 相应 目的 而 保留 的 寄存 器 中 。 通 常情 况 下 , 它们 的 
使 用 可 以 直接 翻译 成 为 机 器 指令 中 的 一 个 地 址 所 使 用 的 某 种 访问 模式 。 如 果 访 问 方式 更 加 复杂 ， 
这 个 访问 就 必须 被 分 解 成 为 多 个 机 器 指令 , 并 且 需 要 创建 一 个 或 多 个 临时 的 符号 化 寄存 器 。 

在 选择 好 了 指令 之 后 , 第 二 趟 处 理 把 物理 寄存 器 指派 给 符号 化 寄存 器 。 这 一 次 处 理 的 目标 
是 寻找 到 一 个 溢出 代价 最 小 的 指派 方法 。 

在 第 二 趟 处 理 中 ,对 每 个 过 程 都 构造 了 一 个 寄存 器 冲突 图 (register-interference graph), BIP 
的 结 点 是 符号 化 寄存 器 。 对 于 任意 两 个 结 点 , 如 果 一 个 结 点 在 另 一 个 被 定 值 的 地 方 是 活跃 的, 那 
么 这 两 个 结 点 之 间 就 有 一 条 边 。 比 如 , 图 8-17 对 应 的 寄存 器 冲突 图 中 有 两 个 结 点 a 和 b。 在 基 
AEB, 中, a 在 对 b 定 值 的 第 二 个 语句 上 是 活路 的 , 因此 在 图 中 结 点 a 和 之 间 有 一 条 边 。 

然后 就 可 以 尝试 用 种 颜色 对 寄存 器 冲突 图 进行 着 色 , 其 中 % 是 可 指派 的 寄存 器 的 个 数 。 一 
个 图 被 称 为 已 着 色 ( colored) 当 且 仅 当 每 个 结 点 都 被 赋予 了 一 个 颜色 , 并 且 没 有 两 个 相 邻 的 结 点 
的 颜色 相同 。 一 种 颜色 代表 一 个 寄存 器 。 着 色 方 案 保证 不 会 把 同一 个 物理 寄存 器 指派 给 两 个 可 
能 相互 冲突 的 符号 化 寄存 器 。 

”一 般 来 说 , 确定 一 个 图 是 否 - 可 着 色 是 一 个 NP 完全 问题 , 但 在 实践 中 我 们 常常 可 以 使 用 下 面 
的 启发 式 技术 进行 快速 着 色 。 假 设 图 G 中 有 一 个 结 点 n, 其 邻居 ( 即 通 过 一 条 边 连 接 到 的 结 点 ) 个 
HUDF kA. 把 n 及 和 nn 相连 的 边 从 G6 中 删除 后 得 到 一 个 图 Co HE G' 的 一 个 着 色 方案 可 以 扩 
展 成 为 一 个 对 G 的 -着 色 方 案 : 只 要 给 nn 指派 一 个 尚未 指派 给 它 的 邻居 的 颜色 就 可 以 了 。 

通过 不 断 地 从 寄存 器 冲突 图 中 删除 边 数 少 于 & 的 结 点 , 要 么 最 终 我 们 得 到 一 个 空 图 , BAG 
到 的 图 中 每 个 结 点 都 至 少 有 上 个 相 邻 的 结 点 。 在 第 一 种 情况 下 , 我 们 可 以 依照 结 点 被 删除 的 相反 
顺序 对 结 点 进行 着 色 ， 从 而 得 到 一 个 原 图 的 刀 -着 色 方 案 。 在 第 二 种 情况 下 已 经 不 存在 k- 着 色 方 
案 了 ©。 此 时 就 需要 通过 引入 保存 和 重新 加 载 寄 存 器 的 代码 , 将 某 个 结 点 溢出 。Chaitin 设计 了 多 
个 用 来 选择 溢出 结 点 的 启发 式 规则 。 总 的 原则 是 避免 在 内 部 循环 中 引入 溢出 代码 。 


O 实际 并 非 如 此 , 例如 由 4 个 结 点 组 成 的 圈 中 , 每 个 结 点 都 有 两 条 边 , 但 是 却 存 在 2- 着 色 方案 : 奇数 点 为 白色 , MA 
数 点 为 黑色 。 作 者 的 意思 可 能 是 指 难以 在 适当 的 时 间 内 找 出 有 着色 方案 一 一 译 者 注 。 
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8.8.5 8.8 节 的 练习 

练习 8. 8. 1: 为 图 8-17 中 的 程序 构造 寄存 器 冲突 图 。 

练习 8. 8. 2: 假设 我 们 在 每 个 过 程 调用 前 在 栈 中 自动 保存 所 有 的 寄存 器 , 并 在 该 过 程 返 回 后 
重新 从 栈 中 恢复 它们 , 请 设计 一 个 寄存 器 分 配 策略 。 


8.9 通过 树 重 写 来 选择 指令 


指令 选择 可 能 是 一 个 大 型 的 排列 组 合 任务 。 对 于 像 CISC 这 样 的 具有 丰富 寻 址 模式 的 机 器 ， 
或 者 具有 某 些 特殊 目的 指令 ( 比如 信号 处 理 指令 ) 的 机 器 尤其 如 此 。 即 使 我 们 假设 求 值 的 顺序 已 
经 给 定 , 并 且 假 设 寄存 器 通过 另 一 个 独立 的 机 制 进行 分 配 ， 指令 选择 一 一 为 实现 中 间 表 示 形 式 中 
出 现 的 运算 符 而 选择 目标 语言 指令 的 问题 一 一 仍然 是 一 个 规模 很 大 的 排列 组 合 任务 。 

在 本 节 中 , 我 们 把 指令 选择 当 作 一 个 树 重 写 问题 来 处 理 。 目 标 指令 的 树 形 表示 已 经 在 代码 
生成 器 的 生成 器 中 得 到 有 效 使 用 。 这 种 生成 器 可 以 依据 目标 机 器 的 高 层 规约 自动 构造 出 一 个 代 
码 生成 器 的 指令 选择 阶段 。 对 于 某 些 机 器 , 相对 于 使 用 树 表示 方法 而 言 , 使 用 DAG 表示 方法 能 
够 生成 更 好 的 代码 。 但 是 DAG 匹配 比 树 匹配 更 加 复杂 。 

8.9.1 树 翻译 方案 

在 这 一 节 中 ,代码 生成 过 程 的 输入 是 一 个 由 目标 机 器 的 语义 层次 上 的 树 组 成 的 序列 。 像 8.3 
节 讨 论 的 那样 在 中 间 代 码 中 插入 运行 时 刻 地 址 之 后 就 可 以 得 到 这 些 树 。 男 外 , 这 些 树 的 叶子 包 
含有 关 它 们 的 标号 的 存储 类 型 的 信息 。 


EERE aso 包含 了 一 个 对 应 于 赋值 语句 下 

ali] =b+1 的 树 , 其 中 数组 a 存放 在 运行 时 刻 人 
Beh, 而 b 是 一 个 存放 在 内 存 位 置 M, 的 全 局 变 4 ke r 
量 。 局 部 变量 a 和 i 的 运行 时 刻 地 址 是 以 相对 Ka yl 


于 sp 的 常数 偏 移 量 C, 和 Ci 的 方式 给 出 的 , HO 
中 sp 是 存放 当前 活动 记录 的 起 始 位 置 的 寄 Co .jsp A 
存 器 。 as 

对 af[i] 的 赋值 是 一 个 间接 赋值 ， Sohal] 

的 位 置 上 的 右 值 被 设置 成 表达 式 b + 1 的 右 值 。 人 
数组 a 和 变量 i 的 地 址 是 通过 分 别 把 常量 C。 和 Ci; 的 值 加 上 寄存 器 SP 的 内 容 而 得 到 的 。 为 了 简 
化 数组 地 址 的 计算 , 我 们 假设 每 个 元 素 值 都 是 一 个 字 节 的 字符 ( 某 些 指令 集中 提供 了 特殊 指令 用 
于 在 地 址 计算 中 进行 乘 数 为 某 些 常数 (比如 2、4、8 等 ) 的 乘法 运算 ) 。 

在 这 棵 树 中 , 运算 符 ind 把 它 的 参数 作为 内 存 地 址 处 理 。 作 为 个 屿 信 运 算 符 的 左 于 结 点 ， 
ind 结 点 指出 了 一 个 内 存 位 置 ,该 位 置 用 来 存放 赋值 运算 符 右 部 的 右 值 。 如 果 一 个 + 或 者 ind 运 
算 符 的 某 个 参数 是 内 存 位 置 或 寄存 器 , 那么 该 内 存 位置 或 寄存 器 中 的 内 容 就 是 参数 的 值 。 这 棵 
树 的 叶子 结 点 的 标号 为 属性 , 而 下 标 表示 属性 的 值 。 口 

目标 代码 是 通过 应 用 一 个 树 重 写 规则 序列 来 生成 的 , 这些 规则 最 终 会 把 输入 的 树 归 约 为 单 
个 结 点 。 各 个 树 重 写 规则 形 如 


Rgp 


replacement«—template | action} 
HH, replacement ( PRE A) 是 一 个 结 点 ，template( 模 板 ) FE— TR , action ( 动作 ) 是 一 个 像 语 
法 制导 翻译 方案 中 那样 的 代码 片断 。 
一 组 树 重 写 规则 被 称 为 一 个 树 翻 译 方 案 (tree-translation scheme) 。 
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每 个 树 重 写 规则 表示 了 如 何 翻译 由 模板 给 出 的 输入 树 的 一 个 片段 。 翻译 中 包含 了 一 组 可 能 
为 空 的 机 器 指令 序列 , 该 序列 由 与 模板 关联 的 动作 发 出 。 和 输入 树 一 样 , 模板 的 叶子 是 带 有 下 标 
的 属性 。 有 时 , 会 存在 一 些 对 于 模板 中 的 下 标 值 的 约束 ， 这 些 约束 通过 语义 断言 来 表示 。 RAW 
足 这 些 约束 才 可 以 匹配 模板 。 比 如 ， 一 个 断言 可 能 规定 某 个 常数 的 值 必须 位 于 某 个 区 间 内 。 
树 翻 译 方案 可 以 很 方便 地 表示 代码 生成 器 的 指令 选择 阶段 。 作为 树 重 写 规则 的 例子 , 考虑 
关于 寄存 器 到 寄存 器 加 法 指令 的 规则 : 


Ri ot rt 
aah 
Ri Rj 


这 个 规则 按照 如 下 方法 使 用 。 如 果 输 入 树 包含 一 个 和 上 面 的 模板 匹配 的 子 树 , 也 就 是 说 , 有 
个子 树 的 根 结 点 的 标号 是 运算 符 +， 且 其 左右 子 结 点 是 寄存 器 i 和 j 中 的 量 , 那么 我 们 可 以 把 
这 个 子 树 替换 为 标号 为 及 的 单一 结 点 , 同时 输出 指令 ADD Ri, Ri, Rjo 我 们 把 这 次 蔡 换 称 为 对 该 
子 树 的 一 次 枚 盖 (tiling)。 在 一 个 给 定时 刻 可 能 有 多 个 模板 与 某 个 子 树 匹 配 ， 我 们 将 简要 描述 在 
冲突 情况 下 决定 应 用 哪个 规则 的 一 些 机 制 。 

EEE aeo 包含 了 我 们 的 目标 机 上 的 一 部 分 指令 的 树 重 写 规则 。 这 些 规则 将 被 用 于 一 个 
贯穿 本 节 的 例子 中 。 前 面 的 两 个 规则 对 应 于 加 载 指令 , 接 下 来 的 两 个 规则 对 应 于 保存 指令 ,其 余 
的 规则 对 应 于 带 有 下 标的 加 载 与 加 法 运算 。 请 注意 , 规则 (8) 要 求 常量 的 值 必须 是 1。 这 个 条 件 
将 用 一 个 语义 断言 来 描述 。 口 


{ ADD Ri, Ri, Rj } 








{LD Ri, #a } 








{ ST 2, Ri } 





{ ST *Ri, Rj } 








{ LD Ri, a(Rj) } 





{ ADD Ri, Ri, a(Rj) } 








{ ADD Ri, Ri, Rj } 


8-20 “一 些 目标 机 指令 的 树 重 写 规则 
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8.9.2 ”通过 覆盖 一 个 输入 树 来 生成 代码 

一 个 树 翻译 方案 按照 下 面 的 方式 工作 。 给 定 一 个 输入 树 , 在 这 些 树 重 写 规则 中 的 模板 被 用 
来 覆盖 输入 树 的 子 树 。 如 果 找到 一 个 匹配 的 模板 , 那么 输入 树 中 匹配 的 子 树 将 被 替换 为 相应 规 
则 中 的 替换 结 点 ,并 且 执 行规 则 的 相关 动作 。 如 果 这 个 动作 包含 了 一 个 机 器 指令 序列 , 那么 就 会 
生成 这 些 指令 。 这 个 过 程 将 一 直 重 复 , 直到 这 个 树 被 归 约 成 单个 结 点 , 或 找 不 到 匹配 的 模板 为 
止 。 在 将 一 个 输入 树 归 约 成 单个 结 点 的 过 程 中 生成 的 机 器 指令 代码 序列 就 是 树 翻译 方案 作用 于 
给 定 输入 树 而 得 到 的 输出 。 

这 样 , 描述 一 个 代码 生成 器 的 过 程 就 变 得 和 使 用 语法 制导 翻译 方案 来 描述 翻译 器 的 过 程 类 
似 。 我 们 写 出 一 个 树 翻译 方案 来 描述 目标 机 的 指令 集合 。 在 实践 中 , 我 们 将 试图 找到 一 个 能 够 ， 
对 每 个 输入 树 生成 代价 最 小 的 指令 序列 的 树 翻译 方案 。 现 在 有 很 多 工具 可 以 帮助 我 们 根据 一 个 
树 翻译 方案 自动 生成 代码 生成 器 。 

PE) 让 我 们 用 图 8-20 的 树 翻译 方案 来 为 图 8-19 中 的 输入 树 生成 代码 。 假 设 第 一 个 规则 用 
干 把 常量 C。 加 载 到 寄存 器 Ro 中 : 
1) Re C { LD RO, #a } 
最 左边 叶子 结 点 的 标号 就 由 C。 变 成 Ro, 同时 生成 了 指令 LD RO, 要。 现在 , 第 七 个 规则 和 最 左 
边 的 根 标号 为 + 的 子 树 匹配 
7) Roy + { ADD RO, RO, SP } 
ae 
使 用 这 个 规则 , 我 们 把 这 棵 子 树 重 写 为 一 个 标号 为 Ro 的 单一 结 点 , 同时 生成 指令 ADD RO, RO, 
SP。 现 在 这 棵 树 如 下 所 示 : 
arte Pe. +4 


| ~ 
+ PA C1 


Ci Rsp 


此 时 , 我 们 可 以 应 用 规则 (5 ) 来 把 子 树 
ind 
| 


| 
Or. ap 

归 约 为 单个 结 点 ,， 设 其 标号 为 Ri 。 我 们 也 可 以 使 用 规则 (6 ) 把 较 大 的 子 树 

oe Fin 


ind 


A 

Ci Rsp 
归 约 为 单个 结 点 Ro, 并 生成 指令 ADD RO, RO, i(SP). BRUA MES RU ARAN TA E 
计算 较 小 的 子 树 更 加 高 效 , 我 们 选择 规则 (6) 得 到 下 面 的 树 ; 

Anal, á eS + 

Ro mae A 
在 右边 的 子 树 中 , 可 将 规则 (2) 可 应 用 于 叶子 结 点 Mo ,并 产生 一 个 把 b 加 载 到 某 个 寄存 器 ( 比方 
说 R1 ) 的 指令 。 现 在 ,使 用 规则 (8 ) 我 们 可 以 匹配 子 树 
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PAETOS 
Rı Ci 
并 生成 增 量 指令 INC R1, BI, 输入 树 已 经 被 归 约 成 为 : 
axe DR 


| 
Ro 


剩 下 的 这 棵 树 和 规则 (4) 匹 配 ， 从 而 把 这 棵 树 归 约 为 单个 结 点 ， 并 生成 指令 ST * RO, R1. 在 把 
树 归 约 成 为 单一 结 点 的 过 程 中 , 我 们 生成 了 下 列 代码 序列 : 


LD RO, #a 

ADD RO, RO, SP 

ADD RO, RO, i(SP) 

LD) Bib 

INC Ri 

ST *RO, R1 加 


为 了 实现 对 例 8. 18 中 的 树 的 归 约 过 程 , 我 们 必须 解决 一 些 和 树 模 式 匹配 相关 的 问题 ; 

。 如 何 完成 树 模 式 匹 配 ? 代码 生成 过 程 ( 在 编译 时 刻 ) 的 效率 依赖 于 树 匹 配 算法 的 

效率 。 

e 如 果 在 某 个 给 定时 刻 有 多 个 模板 可 以 匹配 ,我 们 该 做 什么 ? 生成 的 代码 (在 运行 时 刻 ) 的 

效率 依赖 于 模板 被 匹配 的 顺序 ,因为 不 同 的 匹配 序列 通常 将 产生 不 同 的 目标 机 代码 ,这 
些 代 码 之 间 的 效率 是 不 同 的 。 

如 果 没 有 匹配 的 模板 , 那么 代码 生成 过 程 就 无 法 继续 了 。 在 另 一 种 极端 情况 下 , 我 们 要 防止 
出 现 某 个 单个 结 点 被 重 写 无 穷 多 次 的 可 能 性 。 这 种 情况 会 产生 无 穷 多 个 寄存 器 之 间 的 移动 指令 ， 
或 者 无 穷 多 个 加 载 、 保 存 指令 。 

为 了 避免 阻塞 , 我 们 假设 中 间 代 码 中 的 每 个 运算 符 都 能 够 使 用 一 个 或 多 个 目标 机 器 的 指令 
来 实现 。 我 们 进一步 假设 存在 足够 多 的 寄存 器 用 于 计算 树 的 每 个 结 点 。 那 么 , 不 管 树 匹配 过 程 
如 何 进行 , 剩 下 的 树 总 能 够 被 翻译 成 为 目标 机 器 指令 序列 。 

8. 9.3 通过 扫描 进行 模式 匹配 

在 考虑 通用 的 树 匹配 方法 之 前 , 我 们 先 考虑 一 个 特殊 的 匹配 方法 。 这 个 方法 使 用 LR 语法 分 
析 器 来 完成 模式 匹配 。 输 入 树 可 以 用 前 级 方式 表示 为 一 个 串 。 比 如 , 图 8-19 中 的 树 的 前 缀 表 
es = ind + + Ca Rgp ind + C; Rsp + Ms Ci 

一 个 树 翻 译 方案 可 以 转换 为 一 个 语法 制导 的 翻译 方案 , 方法 是 把 每 个 树 重 写 规则 替换 为 相 
应 的 上 下 文 无 关 文 法 的 产生 式 。 对 于 一 个 树 重 写 规则 , 相应 的 产生 式 的 右 部 就 是 其 指令 模板 的 
前 级 表示 方式 。 

Vee «(218-21 中 的 语法 制导 翻译 方案 是 基于 图 8-20 中 的 树 翻 译 方案 构造 的 。 


相应 文法 的 非 终结 符号 是 及 和 M, 










Rey ick {LD Ri, #a} 
终结 符号 m 表示 特定 的 内 存 位 置 ， 比如 ae | 
例 8.18 中 全 局 变量 b 的 位 置 。 可 以 这 4) M + =ind R; Rj {ST *Ri, Rj} 
么 理解 规则 (10) 中 的 产生 式 Mom: | BR SPS ae ep, tap a RANY 
使 用 涉及 M 的 某 个 模板 之 前 首先 要 把 | DB > the | 
M 和 m 匹配 。 类 似 地 , 我 们 为 寄存 器 9) R=— sp 
SP a|ARA sp, 并 增加 产生 式 |,R (1) Mom 





sp. Bn, 终结 符 c 表示 常量 。 图 8-21 由 图 8-20 构造 得 到 的 语法 制导 翻译 方案 
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使 用 这 些 终 结 符 , 图 8-19 中 的 输入 树 对 应 的 串 是 : 
= ind + + ca sp ind + c; sp + m, ci 回 
根据 这 个 翻译 方案 的 产生 式 , 我 们 可 以 使 用 第 4 章 中 的 某 个 LR 语法 分 析 器 构造 技术 来 构建 
一 个 LR 语法 分 析 器 。 目 标 代 码 通过 每 一 步 归 约 中 发 出 的 机 器 指令 来 生成 。 

一 个 用 于 代码 生成 的 语法 具有 很 大 的 二 义 性 。 在 构造 语法 分 析 器 的 时 候 , 对 于 如 何 处 理 语法 分 
析 动 作 冲 突 的 问题 要 多 加 小 心 。 在 没有 指令 代价 信息 的 时 候 , 总 体 处 理 规则 是 偏向 于 执行 较 大 的 归 
约 , 而 不 是 较 小 的 规约 。 这 意味 着 在 一 个 归 约 -= 归 约 冲突 中 , 优先 选择 较 长 的 归 约 ; 在 一 个 移 
人 = 上 归 约 冲突 中 , 优先 选择 移入 动作 。 这 种 “ 贪 吃 ”的 做 法 使 得 多 个 运算 由 一 条 机 器 指令 完成 。 

在 代码 生成 中 使 用 LR 语法 分 析 方 法 有 多 个 好 处 。 第 一 , 语法 分 析 方 法 是 高 效 的 , 并 且 容 易 。 
被 人 们 理解 。 因 此 , 使 用 第 4 章 中 描述 的 算法 可 以 构造 出 可 靠 和 高 效 的 代码 生成 器 。 第 二 ,比较 
容易 为 所 得 代码 生成 器 重新 确定 目标 。 只 要 写 出 描述 新 机 器 的 指令 集合 的 语法 , 就 可 以 构造 得 
到 一 个 针对 新 机 器 的 代码 选择 器 。 第 三 , 可 以 通过 增加 特殊 产生 式 来 利用 机 器 特有 的 指令 , 从 而 
生成 高 效 的 代码 。 

但 使 用 这 个 方法 也 存在 着 一 些 挑战 。 语 法 分 析 方 法 确定 了 求 值 过 程 必须 是 从 左 到 右 的 。 另 
外 ,对 于 某 些 具有 很 多 种 寻 址 模式 的 机 器 来 说 ,描述 机 器 的 文法 和 由 此 得 到 的 语法 分 析 器 可 能 变 
得 异常 庞大 。 其 结果 是 人 们 不 得 不 使 用 特殊 技术 对 描述 机 器 的 文法 进行 编码 和 处 理 。 我 们 还 必 
须 注意 不 要 让 得 到 的 语法 分 析 器 在 对 表达 式 树 进行 语法 分 析 的 时 候 被 阻塞 ( 即 无 法 进行 下 一 步 动 
VE) 。 造 成 阻塞 的 原因 可 能 是 该 文法 不 能 处 理 某 些 运算 符 的 模式 , 也 可 能 是 语法 分 析 器 在 解决 某 
些 语 法 分 析 动 作 冲 突 的 时 候 做 出 了 错误 的 选择 。 我 们 必须 保证 语法 分 析 器 不 会 进入 无 限 循环 ， 
不 停 地 使 用 右 部 只 有 单个 符号 的 产生 式 进行 归 约 。 Rad eee ae 
候 通过 状态 分 裂 技 术 来 解决 。 

8. 9.4 用 于 语义 检查 的 例 程 

在 一 个 代码 生成 翻译 方案 中 出 现 的 属性 和 输入 树 中 的 属性 是 一 样 的 。 但 是 翻译 方案 中 的 属 
性 常常 带 有 关于 该 属性 下 标的 取 值 的 限制 。 比 如 , 一 个 机 器 指令 可 能 要 求 某 个 属性 的 值 位 于 特 
定 范围 之 内 ,或 者 两 个 属性 的 取 值 之 间 有 一 定 关系 。 

这 些 关 于 属性 值 的 限制 可 以 用 断言 来 描述 。 在 进行 归 约 之 前 需要 判断 相应 的 断言 是 否 被 满 
足 。 实 际 上 , 相对 于 纯 文法 描述 的 方式 而 言 , 语义 动作 和 断言 的 普遍 使 用 能 够 更 加 灵活 、 更 加 容 
易 地 对 代码 生成 器 加 以 描述 。 可 以 使 用 通用 模板 来 描述 各 类 指令 , 然后 使 用 语义 动作 来 为 特定 
情况 选择 指令 。 比 如 , 两 种 不 同 的 加 法 指令 可 以 用 同一 个 模板 来 表示 : 


{ # (a= 1) 
Ri ag t INC Ri 


eet else 


Ri Ca ADD Ri, Ri, #a } 

可 以 通过 特定 的 断言 来 消除 二 义 性 , 解决 语法 分 析 -动作 的 冲突 问题 。 这 些 断言 允许 在 
不 同 的 上 下 文中 使 用 不 同 的 选择 策略 。 因 为 目标 机 体系 结构 的 某 些 方面 (比如 寻 址 模式 ) 可 以 
用 属性 值 来 描述 , 所 以 对 目标 机 器 的 描述 可 以 变 得 更 小 。 这 种 方法 的 复杂 之 处 在 于 人 们 难以 
验证 该 翻译 方案 是 否 可 靠 地 描述 了 目标 机 器 。 当 然 , 所 有 的 代码 生成 器 都 会 或 多 或 少 地 碰 到 
这 个 问题 。 
8.9.5 通用 的 树 匹 配方 法 

基于 前 级 表 示 的 用 于 模式 匹配 的 LR 语法 分 析 方 法 优先 处 理 双 目 运算 符 的 左 运算 分 量 。 在 一 
个 前 缀 表示 op E E, 中 ， 有 限 向 前 看 的 LR 语法 分 析 方 法 中 有 关 扫 描 动作 的 决定 必须 依据 Ei 的 
某 个 前 缀 做 出 。 这 是 因为 E 可 能 具有 任意 长 度 。 右 运算 分 量 可 能 会 带 来 一 些 能 够 在 目标 指令 集 


364 第 8 章 





中 选择 较 好 指令 的 机 会 。 但 是 模式 匹配 方法 可 能 会 错失 这 些 机 会 。 

我 们 也 可 以 弃 用 前 缀 表示 方式 而 使 用 后 级 表示 。 但 是 , 一 个 用 于 模式 匹配 的 LR 语法 分 析 方 
法 会 优先 处 理 右 运算 分 量 。 

对 于 一 个 手写 的 代码 生成 器 , 我 们 可 以 使 用 图 8-20 中 所 示 的 树 模板 作为 指南 , 编写 一 个 专 
门 的 匹配 程序 。 比 如 , 如果 输 入 树 的 根 的 标号 是 ind, 那么 唯一 能 够 匹配 的 是 规则 5 的 模式 ; 否 
则 如 果 根 的 标号 是 + , 那么 可 能 匹配 的 是 规则 6 ~ 8 的 模式 。 

对 于 一 个 可 以 生成 代码 生成 器 的 生成 器 , 我 们 需要 一 个 通用 的 树 匹配 算法 。 通 过 扩展 第 3 章 
中 介绍 的 串 模式 匹配 技术 , 我 们 可 以 开发 出 一 个 高 效 的 自 顶 向 下 算法 。 其 基本 思想 是 把 每 个 模 
板 表示 成 一 个 串 的 集合 , 其 中 每 个 串 对 应 于 模板 中 的 一 条 从 根 到 某 个 叶 结 点 的 路 径 。 通 过 在 串 
中 (从 左 到 右 地 ) 为 每 个 子 结 点 加 入 位 置 编号 , 我 们 平等 地 处 理 每 个 运算 分 量 。 
到 到 在 为 一 个 指令 集 构 建 串 集合 的 时 候 , 我 们 将 去 掉 下 标 。 因 为 进行 模式 匹配 时 只 考虑 
属性 , 而 不 考虑 它们 的 值 。 

图 8-22 中 的 模板 有 如 下 的 从 根 到 叶子 
结 点 的 串 集合 : 


C 

+1R 
+2indl+1C 
+2ind1+2R 
+2 R 


串 C 表示 以 C WRN. H+ 1 RR 图 8-22 一 个 用 于 树 匹 配 的 指令 集 
示 以 + 为 根 的 两 个 模板 中 的 + 号 和 它 的 左 运 算 分 量 R。 O 

使 用 例 8. 22 中 的 串 集 合 可 以 构造 出 一 个 树 模 式 匹配 程序 。 该 程序 使 用 了 可 以 高 效 地 并 行 匹 
配 多 个 串 的 技术 。 

在 实践 中 , 树 重 写 过 程 可 以 按照 如 下 方法 实现 : 对 输入 树 进行 深度 优先 遍历 的 同时 运行 树 模 
式 匹 配 程序 , 并 且 在 最 后 一 次 访问 这 个 结 点 的 时 候 进 行 归 约 。 

如 果 要 考虑 指令 代价 的 问题 , 可 以 给 每 个 树 重 写 规则 关联 一 个 代价 值 。 这 个 值 等 于 应 用 这 
个 规则 时 所 产生 的 代码 序列 的 总 代价 。 在 8. 11 节 中 , 我 们 将 讨论 一 个 可 以 和 树 模式 匹配 算法 联 
合 使 用 的 动态 规划 算法 。 

通过 并 发 地 运行 该 动态 规划 算法 , 我 们 可 以 使 用 各 个 规则 相关 的 代价 信息 来 选择 一 个 
最 优 的 匹配 序列 。 我 们 要 在 各 个 候选 序列 的 代价 值 都 确定 之 后 再 决定 使 用 哪个 匹配 序列 。 
使 用 这 个 方法 , 可 以 根据 一 个 树 重 写 方案 快速 地 构造 出 一 个 小 而 高 效 的 代码 生成 器 。 不 仅 
如 此 ,动态 规划 算法 使 得 代码 生成 器 的 设计 者 不 需要 再 去 解决 匹配 冲突 的 问题 ,或 者 决定 
求 值 的 顺序 。 
8.9.6 8.9 节 的 练习 

练习 8. 9. 1: 为 下 面 的 语句 构造 抽象 语法 树 。 假 设 所 有 不 是 常量 的 运算 分 量 都 存放 在 内 存 中 。 

1) g a at D ead; 

2) I= yh seik]; 

3)z=x+ i; 

使 用 图 8-20 中 的 树 重 写 方案 来 为 每 个 语句 生成 代码 。 

练习 8. 9. 2: 使 用 图 8-21 中 的 语法 制导 翻译 方案 来 替代 树 翻译 方案 , 重复 练习 8.9. 1。 

| 练习 8. 9. 3: 扩展 图 8-20 中 的 树 重 写 方案 , 使 之 可 应 用 于 while 语句 。 

| 练习 8. 9.4: 扩展 树 重 写 技 术 使 之 应 用 于 DAG, 
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8.10 ”表达 式 的 优化 代码 的 生成 


当 一 个 基本 块 仅 包含 单一 的 表达 式 求 值 时 ,或 者 我 们 认为 以 逐次 处 理 各 个 表达 式 的 方式 为 
基本 块 生成 代码 就 已 经 足够 了 ,那么 我 们 就 可 以 最 佳 地 选择 寄存 器 。 在 下 面 的 算法 中 , 我 们 引信 
对 一 个 表达 式 树 ( 即 一 个 表达 式 的 语法 树 ) 的 结 点 添加 数字 标号 的 方案 。 在 使 用 固定 个 数 的 寄存 
器 来 对 一 个 表达 式 求 值 的 情况 下 , 该 方案 允许 我 们 为 表达 式 生成 最 优 的 代码 。 

8. 10. 1 Ershov 数 

一 开始 , 我 们 给 一 个 表达 式 树 的 每 个 结 点 各 赋予 一 个 数值 。 该 数 表示 如 果 我 们 不 把 任何 临 
时 值 存放 回 内 存 的 话 , 计算 该 表达 式 需要 多 少 个 寄存 器 。 这 些 数 有 时 被 称 为 Brshov 4k (Ershov 
number) 。 这 是 根据 A. Ershov 命名 的 ,他 为 只 有 一 个 算术 寄存 器 的 机 器 使 用 了 类 似 的 方案 。 对 我 
们 的 机 器 模型 而 言 ,计算 Ershov 数 的 规则 如 下 : 

1) 所 有 叶子 结 点 的 标号 为 1。 

2) 只 有 一 个 子 结 点 的 内 部 结 点 的 标号 和 其 子 结 点 的 标号 相同 。 

3) 具有 两 个 子 结 点 的 内 部 结 点 的 标号 按照 如 下 方式 确定 : 

D 如 果 两 个 子 结 点 的 标号 不 同 ,那么 选择 较 大 的 标号 。 

O 如 果 两 个 子 结 点 的 标号 相同 ,那么 它 的 标号 就 是 子 结 点 的 标号 值 加 一 。 

EEE 823, 我 们 可 以 看 到 一 个 表达 式 树 (其 中 的 运算 符 已 经 被 省 略 ) 。 这 个 树 可 能 
是 表达 式 (a -6) +ex (c+d) 的 树 , 或 者 说 是 下 面 的 三 地 址 代码 的 树 ; 
tl=a-b 
2) = e +d 


t3 =e * t2 
t4 = t1 + t3 


根据 规则 (1) , 该 树 的 五 个 叶子 结 点 的 标号 都 是 
1。 然 后 , 我 们 可 以 给 对 应 于 tl1 =a -b 的 内 部 
结 点 加 上 标号 ,因为 它 的 两 个 子 结 点 都 已 经 被 加 
上 了 标号 。 应 用 规则 3, 该 结 点 的 标号 是 它 的 子 A 
结 点 的 标号 加 上 1; 也 就 是 2。 对 应 于 t2 =-c +a a Bod ep Sig 
的 结 点 的 标号 的 计算 方式 与 此 类 似 。 

现在 我 们 可 以 计算 对 应 于 t3 =e * t2 的 结 点 的 标号 。 它 的 子 结 点 的 标号 是 1 和 2 因此 根 
据 规则 3, t3 对 应 结 点 的 标号 是 其 中 的 较 大 值 , 即 2。 最 后 计算 根 结 点 ， 即 对 应 于 t4 tl t3 
的 结 点 。 它 的 两 个 子 结 点 的 标号 都 是 2, 因此 它 的 标号 是 3。 = 
8.10.2 ， 从 带 标号 的 表达 式 树 生成 代码 

假设 在 我 们 的 机 器 模型 中 , 所 有 的 运算 分 量 都 必须 在 寄存 器 中 , 且 寄 存 器 可 以 同时 用 于 存放 
某 个 运算 的 运算 分 量 和 结果 。 可 以 证 明 ,如果 在 计算 表达 式 的 过 程 中 不 允许 把 中 间 结 果 保 存 回 
内 存 , 那么 一 个 结 点 的 标号 就 等 于 计算 该 结 点 对 应 的 表达 式 时 需要 的 最 少 的 寄存 器 个 数 。 因 为 
在 这 个 机 器 模型 中 , 我 们 必须 把 每 个 运算 分 量 加 载 到 寄存 器 中 ， 且 必须 计算 每 个 内 部 结 点 所 对 应 
的 中 间 结果 , 所 以 , 造成 生成 代码 不 是 最 优 代码 的 唯一 可 能 是 我 们 使 用 了 不 必要 的 将 临时 结果 在 
回 内 存 的 指令 。 对 这 个 断言 的 证 明 包含 在 下 面 的 算法 中 。 这 个 算法 生成 的 代码 不 包含 将 临时 结 
果 存 回 内 存 的 指令 , 而 这 个 代码 所 使 用 的 寄存 器 数目 就 是 根 结 点 的 标号 
EAE 根据 一 个 带 标号 的 表达 式 树 生成 代码 。 

输入 : 一 个 带 有 标号 的 表达 式 树 , 其 中 的 每 个 运算 分 量 只 出 现 一 次 ( 即 没有 公共 子 表达 式 ) 。 
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输出 : 计算 根 结 点 对 应 的 值 并 将 该 值 存放 在 一 个 寄存 器 中 的 最 优 的 机 器 指令 序列 。 

方法 : 下 面 是 一 个 用 来 生成 机 器 代码 的 递归 算法 。 从 树 的 根 结 点 开始 应 用 下 面 的 步骤 。 如 
果 算 法 被 应 用 于 二 个 标号 为 石 的 结 点 ， 那么 得 到 的 代码 只 使 用 站 个 寄存 器 。 然 而 ， 这 些 代 码 从 某 
个 基线 5(5 宇 1) 开 始 使 用 寄存 器 , 实际 使 用 的 寄存 器 是 R, Roio o Ro 4.4-1。 计 算 结 果 总 是 存 
放 在 R, +k-1 HF 

1) 为 一 个 标号 为 6 且 两 个 子 结 点 的 标号 相同 (它们 的 标号 必然 是 -1) 的 内 部 结 点 生成 代码 
时 , 做 如 下 处 理 : 

D 使 用 基线 5+1 递归 地 为 它 的 右 子 树 生 成 代码 。 其 右 子 树 的 结果 将 存放 在 寄存 器 Ry -li 中。 

@ 使 用 基线 5, 递归 地 为 它 的 左 子 树 生成 代码 。 其 左 子 树 的 结果 将 存放 在 寄存 器 Ry 2 Po 

@ 生成 指令 “OPiR, apis Roera Roari” 其 中 OP 是 标号 为 的 结 点 对 应 的 运算 。 

2) 假设 我 们 有 一 个 标号 为 的 内 部 结 点 , 其 子 结 点 的 标号 不 相等 。 那 么 , 它 必然 有 一 个 子 
结 点 的 标号 为 £, 我 们 称 之 为 “大 子 结 点 ”; 而 另 一 个 子 结 点 的 标号 为 某 个 m <k, CRRA DF 
结 点 ” 。 使 用 基线 5, 通过 下 列 步骤 为 这 个 内 部 结 点 生成 代码 ; 

D 使 用 基线 5, 递归 地 为 大 子 结 点 生成 代码 , 其 结果 存放 在 寄存 器 Rpr- Po 

@ 使 用 基线 b, 递归 地 为 小 子 结 点 生成 代码 , 其 结果 存放 在 寄存 器 R,; -1 中 。 请 注意 , 因为 
m<k, 寄存 器 Ry ,4_1 和 编号 更 高 的 寄存 器 都 没有 被 使 用 。 

@ 根据 大 子 结 点 是 该 内 部 结 点 的 右 子 结 点 还 是 左 子 结 点 ， 分 别 生 成 指令 OP Ryki 
Rem lr Rieke RA OER et Mis volte’ ye 

3) 对 于 代表 运算 分 量 % 的 叶子 结 点 ， 当 基线 为 8 时 生成 指令 “LD R,, x”. a 
让 我 们 把 算法 8. 24 应 用 于 图 8-23 中 的 树 。 因 为 根 结 点 的 标号 是 3， 其 结果 将 存放 在 
Rs 中 , 并 且 只 有 寄存 器 RI Ra R 被 使 用 。 根 结 点 的 基线 是 b=1。 因 为 根 结 点 的 两 个 子 结 点 的 
标号 相同 , 我 们 首先 以 2 为 基线 生成 右 子 结 点 的 代码 。 

当 我 们 为 根 结 点 的 标号 为 3 的 右 子 结 点 生成 代码 时 , 我 们 发 现 该 子 结 点 的 大 子 结 点 是 其 右 
子 结 点 , 而 小 子 结 点 是 其 左 子 结 点 。 这 样 , 我 们 首先 以 2 为 基 
线 生 成 右 子 结 点 的 代码 。 应 用 针对 具有 相同 标号 子 结 点 和 叶 
子 结 点 的 规则 , 我 们 为 标号 2 的 结 点 生成 下 列 代码 : 


LD R3, d 
LD R2,<c 
ADD R3, R2, R3 


接 下 来 , 我 们 为 根 结 点 的 右 子 结 点 的 左 子 结 点 生成 代码 。 这 
是 一 个 标号 为 e 的 叶子 结 点 。 因 为 6=2, 正确 的 指令 是 


LD R2, 6 图 8-24 图 8-23 中 的 树 的 
现在 我 们 加 上 指令 最 优 的 三 地 址 代码 


MUL R3, R2, R3 
就 完整 地 生成 了 根 结 点 的 右 子 结 点 的 代码 。 算 法 继续 以 1 为 基线 生成 根 结 点 的 左 子 结 点 的 代码 ， 
并 把 结果 放 在 尼 中。 图 8-24 中 显示 了 生成 的 全 部 指令 序列 。 口 
8.10.3 ”寄存 器 数量 不 足 时 的 表达 式 求 值 

当 可 用 寄存 器 的 数量 少 于 树 的 根 结 点 的 标号 时 ,我们 不 能 直接 应 用 算法 8. 24。 此 时 需要 引 
和 人 一 些 保存 指令 , 把 某 些 子 树 的 值 溢出 到 内 存 中 ,然后 在 必要 的 时 候 生 成 加 载 指令 把 那些 值 再 加 
载 到 寄存 器 中 。 下 面 是 一 个 经 过 修改 的 代码 生成 算法 ， 它 考虑 了 寄存 器 数量 的 限制 。 
ECAJ 根据 一 个 带 标号 的 表达 式 树 生成 代码 。 
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输入 : 一 个 带 有 标号 的 表达 式 树 和 寄存 器 的 数量 ">=2。 表 达 式 树 的 每 个 运算 分 量 只 出 现 一 
次 ( 即 没有 公共 子 表达 式 ) 。 

输出 : 计算 根 结 点 对 应 的 值 并 将 其 存放 到 一 个 寄存 器 中 的 最 优 的 机 器 指令 序列 。 代 码 使 用 
的 寄存 器 的 数量 不 大 于 r+。 我 们 假设 这 些 寄存 器 为 Ri, R,,…, Reo 

方法 : SHA b=1, 从 根 结 点 开始 应 用 下 面 的 递归 算法 。 对 于 标号 为 > 或 者 更 小 的 结 点 NN， 
本 算法 和 算法 8. 24 完全 一 样 , 这 里 不 再 重复 。 但 是 , 对 于 标号 >7r 的 内 部 结 点 ,我们 要 分 别处 
理 该 内 部 节点 的 各 个 子 结 点 ,并 把 较 大 子 树 的 结果 保存 到 内 存 中 。 该 结果 在 对 结 点 NN 求 值 之 前 
才 从 内 存 重新 加 载 , 而 最 后 的 求 值 步骤 将 在 R, .1 和 R, 内 进行 。 对 于 基本 算法 的 改动 如 下 : 

1) 4 N 至 少 有 一 个 子 结 点 的 标号 为 r 或 者 大 于 r。 选 择 较 大 的 子 结 点 (如 果子 结 点 标号 相 
同 则 选择 任意 一 个 ) 作 为 “大 ” 子 结 点 ; 并 把 另外 一 个 子 结 点 作为 “小 ” 子 结 点 。 

2) 令 基 线 b=1, 递归 地 为 大 子 结 点 生成 代码 。 这 个 求 值 的 结果 将 存放 在 寄存 器 R, 中 。 

3) 生成 机 器 指令 “sT tp, R”, FEP tp 是 一 个 用 于 存放 中 间 结 果 的 临时 变量 。 这 个 变量 用 于 
对 标号 为 的 结 点 求 值 。 

4) 按照 如 下 方式 为 小 子 结 点 生成 代码 。 如 果 小 子 结 点 的 标号 大 于 或 等 于 7+, 选取 基线 5 = 1。 
如 果 小 子 结 点 的 标号 为 j<r, 选取 基线 5=r -j。 然 后 递归 地 把 本 算法 应 用 于 小 子 结 点 , 其 结果 存 
WTE R, 中。 

SA STD Run 

6) 如 果 大 子 结 点 是 W 的 右 子 结 点 ,生成 指令 “OP R, Ry Ra” o 如 果 大 子 结 点 是 入 的 左 子 
结 点 ， 生 成 代码 “OP R,, Roir Ro O 
ODEJ 现在 假设 =2, 让 我 们 重新 回顾 一 下 图 8-23 所 代表 的 表达 式 。 也 就 是 说 , 只 有 寄存 器 
R1 和 R2 可 以 用 来 存放 表达 式 求 值 过 程 中 产生 的 临时 结果 。 当 我 们 把 算法 8. 26 应 用 到 图 8223 中 
时 , 我 们 看 到 根 结 点 的 标号 (3) 大 于 " =2。 这 样 , 我 们 需要 选择 其 中 的 一 个 子 结 点 作为 大 子 结 点 。 
因为 子 结 点 的 标号 相同 , 我 们 可 以 任 选 其 中 的 一 个 。 假 设 我 们 选择 了 右 子 结 点 作为 大 子 结 点 。 

因为 根 结 点 的 大 子 结 点 的 标号 为 2, 因此 寄存 器 是 够 用 的 。 我 们 把 算法 8. 24 应 用 到 这 个 子 
树 , 其 中 基线 5=1, 而 寄存 器 个 数 为 2。 最 终 的 结果 和 我 们 在 图 8-24 中 生成 的 代码 很 相似 , 但 原 
来 的 寄存 器 R2 和 R3 被 替换 为 R1 和 R2。 代 码 如 下 : 


EDMRZ, id 
iDa Rl ec 
ADD R2, R1, R2 
LD Ri, e 
MUL R2, R1, R2 


现在 , 因为 我 们 要 把 这 两 个 寄存 器 都 用 于 根 结 点 的 左 子 树 , 我 们 需要 生成 指令 
ST Tt3, MR2 

接 下 来 处 理 根 结 点 的 左 子 结 点 。 同 样 ,寄存 器 的 数量 足以 处 理 这 个 

子 结 点 ; 代码 如 下 : 


LD R2, b 
LE RI a 
SUB R2, R1, R2 


最 后 , 我 们 用 指令 





LD Ri, t3 

把 存放 了 根 结 点 的 右 子 结 点 的 值 的 临时 变量 重新 加 载 到 寄存 器 中 ， 

并 使 用 指令 图 8-25 8-23 中 的 树 的 
ADD R2, R2, R1 最 优 的 三 寄存 器 代码 


执行 树 的 根 结 点 上 的 运算 。 完 整 的 指令 序列 显示 在 图 825 p, O (只 使 用 两 个 寄存 器 ) 


vv ee we 
8. 10.4 8. 10 节 的 练习 

练习 8. 10. 1: 计算 下 列表 达 式 的 Ershov 数 。 

1) a/(b+c) -d *(e+f) 

2) at+b«(cx(dte)) 

3) (-at+ kp) *((b- *q)/( -c+ *r)) 

练习 8. 10. 2: 使 用 两 个 寄存 器 为 练习 8. 10. 1 中 的 各 个 表达 式 生成 最 优 的 代码 。 

练习 8.10.3: 使 用 三 个 寄存 器 为 练习 8. 10.1 中 的 各 个 表达 式 生 成 最 优 的 代码 。 

| 练习 8. 10.4: 将 Ershov 数 的 计算 方法 一 般 化 , 使 之 能 够 处 理 其 中 某 些 内 部 结 点 具有 三 个 
或 更 多 的 子 结 点 的 表达 式 树 。 

| 练习 8. 10.5: 类 似 于 a[i] -x 的 对 数组 元 素 的 赋值 看 起 来 像 一 个 具有 三 个 运算 分 量 (a、 
i 和 x%) 的 运算 符 。 你 将 如 何 修改 给 表达 式 树 添加 标号 的 方案 ， 以 便 为 这 种 机 器 模型 生成 最 优 的 
代码 ? 

| 练习 8. 10. 6: 最 初 的 Ershov 数 技术 所 应 用 的 机 器 模型 和 书 中 的 模型 有 所 不 同 。 该 模型 允 
许 二 个 表达 式 的 右 运算 分 量 存放 在 内 存 中 , 而 不 一 定 要 存放 在 寄存 器 中 。 你 将 如 何 修改 为 表达 
式 树 添加 标号 的 方案 , 使 得 它 可 以 为 这 种 机 器 模型 生成 最 优 代码 ? 

| 练习 8. 10.7: 某 些 机 器 要 求 使 用 两 个 寄存 器 来 存放 某 些 单 精 度 值 。 假 设 单 寄 存 器 值 的 乘 
法 的 结果 需要 两 个 连续 的 寄存 器 , 而 当 我 们 计算 a/b 时 , a 的 值 必须 存放 在 两 个 连续 的 寄存 器 中 。 
你 将 如 何 修改 为 表达 式 树 添加 标号 的 方案 , 使 得 它 可 以 为 这 种 机 器 模型 生成 最 优 代码 ? 


8. 11 ”使 用 动态 规划 的 代码 生成 


8. 10 节 中 的 算法 8.26 根据 一 个 表达 式 树 生成 最 优 代码 所 需 的 时 间 是 树 的 大 小 的 线性 函数 。 
适合 使 用 这 个 过 程 的 机 器 要 满足 以 下 假设 : 所 有 的 计算 都 在 寄存 器 中 完成 , 而 指令 中 包含 的 运算 
符 要 么 作用 于 两 个 寄存 器 , 要 么 作用 于 一 个 寄存 器 和 一 个 内 存 位 置 。 

基于 动态 规划 原理 的 算法 可 以 应 用 到 更 多 类 型 的 机 器 上 , 使 得 人 们 可 以 在 线性 时 间 内 为 一 
个 表达 式 树 生成 最 优 代码 。 动 态 规划 算法 可 以 被 应 用 到 具有 复杂 指令 集 的 多 种 计算 机 上 。 

O 只 要 一 个 机 器 具有 7 个 可 互 换 的 寄存 器 R0，R1，…， Rr -1 以 及 加 载 、 保 存 和 运算 指令 ， 就 
可 以 应 用 基于 动态 规划 的 算法 为 这 个 机 器 生成 代码 。 为 简单 起 见 , 我 们 假设 每 个 指令 的 代价 是 
一 个 成 本 单位 。 然 而 , 即使 每 个 指令 具有 不 同 的 代价 值 ， 人 们 也 可 以 很 容易 地 修改 这 个 算法 来 处 
8.11.1 连续 求 值 

动态 规划 算法 把 为 一 个 表达 式 生成 最 优 代码 的 问题 分 解 成 为 多 个 为 该 表达 式 的 子 表 达 式 生 
成 最 优 代 码 的 子 问题 。 作 为 一 个 简单 的 例子 , 考虑 一 个 形 如 E +E WERE. 的 一 个 最 优 
程序 由 El ME, 的 最 优 程序 以 某 种 顺序 组 合 而 成 , 然后 是 对 + 求 值 的 代码 。 为 BL M E, 生成 最 
优 程序 的 子 问 题 也 以 类 似 的 方式 解决 。 

由 动态 规划 算法 产生 的 最 优 程序 有 一 个 重要 的 性 质 。 该 代码 以 “连续 ” 的 方式 计算 表达 式 
E =E, op 82。 我 们 可 以 通过 查看 忆 的 语法 树 了 来 理解 这 句 话 的 含义 。 

D 


(2) @ 
Ti as To 


这 里 , Ti MT, 分 别 是 El 和 E 的 语法 树 。 
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我 们 说 一 个 程序 己 连续 计算 -一 棵 树 7, 如 果 它 首先 计算 那些 需要 计算 值 并 将 其 存放 到 内 存 中 
的 7 的 子 树 。 然 后 , 它 再 计算 7 的 其 余部 分 , 计算 的 顺序 可 以 是 T, Th, RAR, RA T, Tis 
根 结 点 。 无 论 在 哪 种 情况 下 ,作为 非 连 续 计 算 的 一 个 例子 ,程序 P 可 能 先 计算 T 的 一 部 分 并 把 
结果 存放 在 一 个 寄存 器 中 ( 而 不 是 内 存 中 ) ,然后 计算 Ty, 然后 再 回 过 来 计算 71 的 其 余部 分 。 

对 于 本 节 中 的 寄存 器 机 器 ,我 们 可 以 证 明 对 于 任何 一 个 计算 表达 式 树 7 的 机 器 语言 程序 P， 
我 们 都 可 以 找到 一 个 等 价 的 程序 已 ,使 得 

1) P' 的 代价 不 高 于 P 的 代价 。 

2) P' 使 用 的 寄存 器 不 多 于 使 用 的 寄存 器 , 而 且 

3) P' 连 续 地 对 该 树 求 值 。 

这 个 结果 表明 , 每 个 表达 式 树 可 以 用 一 个 连续 程序 最 优 地 求 值 。 

相对 而 言 ,使 用 偶数 -奇数 寄存 器 对 的 计算 机 不 一 定 总 是 具有 最 优 的 连续 求 值 过 程 。x86 体 
系 结 构 在 乘法 和 除法 中 使 用 寄存 器 对 。 对 于 这 样 的 机 器 , 我 们 可 以 给 出 一 些 表达 式 树 的 例子 。 
这 些 树 的 最 优 机 器 语言 程序 必须 首先 对 根 的 左 子 树 的 一 部 分 进行 求 值 并 把 结果 存放 到 寄存 器 中 ， 
然后 处 理 右 子 树 的 一 部 分 ,再 处 理 左 子 树 的 另 一 部 分 , 如 此 往复 。 使 用 本 节 中 的 机 器 对 任意 一 个 
表达 式 树 进行 最 优 求 值 时 , 没有 必要 进行 这 种 类 型 的 摆动 。 

上 面 定义 的 连续 求 值 的 性 质保 证 了 对 于 任何 表达 式 树 7, 总 是 存在 一 个 最 优 程序 。 这 个 程序 
由 根 结 点 的 子 树 的 最 优 程序 组 成 , 最 后 是 计算 根 结 点 值 的 指令 。 这 个 性 质 支持 我 们 使 用 一 个 动 
态 规划 算法 为 了 生成 一 个 最 优 程序 。 

8.11.2 动态 规划 的 算法 

动态 规划 算法 有 三 个 步骤 (假设 目标 机 器 具有 7 个 寄存 器 ) : 

1) 对 表达 式 树 卫 的 每 个 结 点 ” 自 底 向 上 地 计算 得 到 一 个 代价 数组 C, 其 中 C 的 第 i 个 元 素 
C[] 是 在 假设 有 i(1<i<7) 个 可 用 寄存 器 的 情况 下 对 以 n 为 根 的 子 树 5 求 值 并 将 结果 存放 在 一 
个 寄存 器 中 的 最 优 代价 。 

2) 遍历 7, 使 用 代价 向 量 ( 数 组 ) 来 决定 的 哪 棵 子 树 应 该 被 计算 并 保存 到 内 存 中 。 

3) 使 用 每 个 结 点 的 代价 向 量 和 相关 指令 来 遍历 各 棵 子 树 并 生成 最 终 的 目标 代码 。 在 这 个 过 
程 中 , 首先 为 那些 需要 把 结果 值 保存 到 内 存 的 子 树 生成 代码 

上 述 每 一 个 步 又 都 可 以 高 效 地 实现 , 运行 所 需 时 间 与 表达 式 树 的 大 小 成 线性 关系 。 

计算 一 个 结 点 的 代价 包括 在 给 定 寄存 器 数 量 的 情况 下 对 S 求 值 时 所 需要 的 全 部 加 载 和 保 
存 运算 , 也 包括 了 计算 5 的 根 结 点 处 的 运算 符 所 需要 的 代价 。 代 价 向 量 的 第 0 个 元 素 存放 的 是 把 
子 树 S 的 值 计 算出 来 并 保存 到 内 存 的 最 优 代价 。 只 需要 考虑 5 的 根 结 点 的 各 子 树 的 最 优 程序 的 
不 同 组 合 ,就 可 以 生成 $ 的 最 优 程序 。 这 是 由 连续 求 值 的 性 质 来 确保 的 。 这 个 限制 减少 了 需要 考 
虑 的 情况 。 

为 了 计算 结 点 nn 的 代价 Cli], 我们 像 8.9 节 中 那样 把 指令 看 作 是 树 重 写 规则 。 考 虑 和 结 点 " 
处 的 输入 树 相 匹配 的 各 个 模板 五 。 只 要 检查 n 的 相应 后 代 的 代价 向 量 , 就 可 以 确定 对 五 的 叶子 结 
点 所 代表 的 运算 分 量 进行 求 值 时 所 需要 的 代价 。 对 于 五 的 寄存 器 运算 分 量 , 考虑 对 了 的 相应 子 
树 求 值 并 放 到 寄存 器 中 的 各 种 可 能 的 顺序 。 在 每 个 顺序 中 , 第 一 个 对 应 于 某 个 寄存 器 运算 分 量 
的 子 树 可 以 使 用 i 个 寄存 器 , 而 第 二 个 则 使 用 i -1 个 寄存 器 , 以 此 类 推 。 考 虑 结 点 时, 需要 加 
上 和 模板 相关 的 指令 的 代价 。C[ 门 的 值 就 是 所 有 这 些 可 能 的 顺序 所 对 应 的 代价 值 中 的 最 小 者 。 

整 棵 树 7 的 代价 向 量 可 以 用 自 底 向 上 的 方式 计算 。 计 算 所 需 时 间 和 7 了 中 结 点 的 个 数 呈 线性 
正比 关系 。 在 每 个 结 点 上 为 各 个 i 值 保存 用 于 获得 最 优 代价 C[ 引 所 使 用 的 指令 可 以 带 来 方便 。7 
的 根 结 点 的 代价 向 量 中 的 最 小 值 给 出 了 对 了 求 值 所 需 的 最 小 代价 。 


370 第 8 章 





考虑 有 两 个 寄存 器 RO、R1 及 下 列 的 指令 的 机 器 。 每 个 指令 的 代价 是 一 个 成 本 单位 : 
LD Ri, Mj // Ri = Mj 
op Ri, Ri, Ry // Ri = Ri op Rj 
op Ri, Ri, My // Ri = Ri op Mj 
ED Ri, Rj // Ri = Rj 
ST Mi, Rj // Mi = Rj 


在 这 些 指令 中 , Ri 可 以 是 RO 或 者 R1, 而 区 则 是 一 个 内 存 位 置 。 运 算 符 op 对 应 于 某 个 算术 
运算 符 。 

让 我 们 应 用 动态 规划 算法 为 图 8-26 中 的 语法 树 生成 最 优 的 代码 。 在 第 一 步 中 , 我 们 计算 每 
个 结 点 的 代价 向 量 。 这 些 向 量 在 图 中 各 个 结 点 的 旁边 显示 。 为 了 说 明代 价 计算 方法 , 考虑 在 叶 
子 结 点 a 处 的 代价 向 量 。C[0]( 即 计算 a 并 保存 到 内 存 的 代价 ) 是 0, 因为 它 已 经 在 内 存 中 了 。 
C[1]( 即 计算 a 并 保存 到 一 个 寄存 器 的 代价 ) 是 1, 因为 我 们 可 以 使 用 指令 LD RO, a 把 它 加 载 到 
一 个 寄存 器 中 。C[2]( 即 在 有 两 个 可 用 寄存 器 的 情况 下 把 a 加 载 到 一 个 寄存 器 中 的 代价 ) 和 只 有 
一 个 可 用 寄存 器 的 情况 下 的 代价 是 一 样 的 。 因 此 , 在 叶子 结 点 a 上 的 代价 向 量 是 (0，1，1)。 





8-26 表达 式 (a -b) +c* (dd/e) 的 语法 树 , 每 个 结 点 都 标 有 代价 向 量 


考虑 一 下 根 结 点 处 的 代价 向 量 。 我 们 首先 确定 在 有 一 个 及 两 个 可 用 寄存 器 的 情况 下 计算 根 
结 点 所 需 的 最 小 代价 。 因 为 根 结 点 的 标号 是 + ， 所 以 机 器 指令 ADD RO, RO, M 和 根 结 点 匹配 。 
使 用 这 个 指令 , 在 只 有 一 个 可 用 寄存 器 的 情况 下 对 根 结 点 求 值 的 最 小 代价 的 计算 方法 如 下 : 对 其 
右 子 树 求 值 并 存放 到 内 存 的 最 小 代价 , 加 上 计算 其 左 子 树 并 保存 到 寄存 器 的 最 小 代价 , 再 加 上 该 
指令 的 代价 1。 不 存在 其 他 的 最 小 代价 的 计算 方式 。 在 根 结 点 的 左右 子 结 点 上 的 代价 向 量 说 明 在 
只 有 一 个 可 用 寄存 器 的 情况 下 对 根 结 点 求 值 的 最 小 代价 是 5+2+1 =8。 

现在 考虑 有 两 个 可 用 寄存 器 时 对 根 结 点 求 值 的 最 小 代价 。 根 据 用 于 计算 根 结 点 的 不 同 指令 ， 
以 及 对 根 结 点 的 左右 子 树 求 值 的 不 同 顺序 , 需要 考虑 三 种 情况 。 1 

1) 使 用 两 个 可 用 寄存 器 计算 左 子 树 的 值 并 放 到 寄存 器 RO 中 , 使 用 一 个 可 用 寄存 器 计算 右 
子 树 的 值 并 放 到 寄存 器 RL 中 ,并 使 用 指令 ADD RO, RO, R1 来 计算 根 结 点 。 这 个 指令 序列 的 代 
价 是 5 +2+1=8。 

2) 使 用 两 个 可 用 寄存 器 计算 右 子 树 的 值 并 存放 到 R1 中 , 使 用 一 个 可 用 寄存 器 计算 左 子 树 的 值 
并 存放 到 RO 中 , 并 使 用 指令 ADD RO, RO, R1 计算 根 结 点 。 这 个 指令 序列 的 代价 为 4+2+1=7。 

3) 计算 右 子 树 的 值 并 保存 到 内 存 位 置 M 中 , 使 用 两 个 可 用 寄存 器 计算 左 子 树 的 值 并 保存 到 
寄存 器 RO 中 ,并 使 用 指令 ADD RO, RO, M 计算 根 结 点 的 值 。 这 个 指令 序列 的 代价 是 
5+2+1=8, 

可 见 , 第 二 种 选择 给 出 了 最 小 的 代价 7。 

计算 根 结 点 的 值 并 保存 到 内 存 中 的 代价 等 于 使 用 所 有 可 用 寄存 器 计算 根 结 点 的 值 的 最 小 代 
价 再 加 上 1。 也 就 是 说 , 我 们 首先 计算 根 结 点 并 将 其 存放 到 一 个 寄存 器 中 , 然后 保存 结果 。 因 此 ， 
在 根 结 点 处 的 代价 向 量 是 (8, 8, 7)。 
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根据 代价 向 量 ; 我 们 可 以 很 容易 地 通过 对 树 的 遍历 构造 出 代码 序列 。 假 设 有 两 个 可 用 寄存 
器 , 图 8-26 的 树 的 最 优 代 码 序列 是 : 


LD 
LD 


DIVLRL R1, Le // Ri = 
MUL RO, RO, R1 /4 RO 


LD 


ROSE // RO = Cc 
Ric 7A BA = 8 


Ris: a // Riza 


SUB R1, Ri, b // R1 = RL - b 
ADD Ri, R1, RO // Ri = R1.+ RO fel 


动态 规划 技术 已 经 在 很 多 编译 器 中 使 用 , 这 些 编译 器 包括 可 移植 C 编译 器 版 本 2， 即 PCC2。 
因为 动态 规划 技术 可 以 用 到 很 多 类 型 的 机 器 上 , 这 个 技术 促进 了 编译 器 的 可 重 定向 特性 的 发 展 。 
8.11.3 8.11 节 的 练习 

练习 8.11.1: 在 图 820 中 的 树 重 写 方案 中 增加 代价 信息 , 并 用 动态 规划 和 树 匹配 技术 来 为 
练习 8.9. 1 中 的 语句 生成 代码 。 


8. 12 


练习 8; 11.2: 你 将 如 何 扩展 动态 规划 技术 , 以 便 在 DAG 的 基础 上 生成 最 优 代码 ? 
第 8 章 总 结 


代码 生成 是 编译 器 的 最 后 一 个 步骤 。 代 码 生 成 器 把 前 端 生成 的 中 间 表 示 形 式 映射 为 目标 
程序 。 如 果 存 在 一 个 代码 优化 阶段 , 那么 代码 生成 器 的 输入 就 是 代码 优化 器 生成 的 中 间 
表示 形式 。 

虽 令 选择 是 为 每 个 中 间 表 示 语 名 选择 目标 语言 指 念 的 过 程 。 

寄存 器 分 配 是 决定 哪些 IR 值 将 会 保存 在 寄存 器 中 的 过 程 。 图 着 色 算法 是 一 个 在 编译 器 中 
完成 寄存 器 分 配 的 有 效 技术 。 

寄存 器 指派 是 决定 用 哪个 寄存 器 来 存放 一 个 给 定 的 IR 值 的 过 程 。 

可 重 定向 编译 器 是 能 够 为 多 个 指令 集 生成 代码 的 编译 器 。 

虚拟 机 是 一 些 字 节 代码 中 间 语 言 的 解释 程序 , 这些 字 节 代 码 是 为 诸如 Java 和 C# 这 样 的 语 


言 生成 。 
CISC 机 器 通常 是 一 个 工地 址 机 器 。 它 的 寄存 器 相对 较 少 ， 有 几 种 寄存 器 类 型 ， 并 具有 复 
杂 寻 址 模式 的 可 变 长 指令 。 


RISC 机 器 通常 是 一 个 三 地 址 机 器 。 它 拥有 很 多 寄存 器 ,上 且 运 算 都 在 寄存 器 中 进行 。 
基本 块 是 一 个 三 地 址 语句 的 最 大 连续 序列 。 控 制 流 只 能 从 它 的 第 一 个 语句 进入 , 并 从 最 
后 一 个 语句 离开 , 中 间 没 有 停顿 , 且 除 了 基本 块 的 最 后 一 个 语句 之 外 没有 分 支 语句 。 

流 图 是 程序 的 一 种 图 形 化 表示 方式 。 其 中 图 的 结 点 是 基本 块 ,而 图 的 边 显 示 了 控制 流 如 
何在 基本 块 之 间 流 动 。 

流 图 中 的 循环 是 一 个 强 连 通 的 区 域 。 这 个 区 域 只 有 一 个 被 称 为 循环 首 结 点 的 入 口 。 
基本 块 的 DAG 表示 是 一 个 有 向 无 环 图 。DAG 中 的 结 点 表示 基本 块 中 的 语句 , 而 一 个 结 点 
的 各 个 子 结 点 所 对 应 的 语句 是 最 晚 对 该 结 点 对 应 语句 的 某 个 运算 分 量 进行 定 值 的 语句 。 
宕 孔 优化 是 一 种 提高 代码 质量 的 局 部 变换 。 它 通常 通过 一 个 滑动 窗口 作用 于 一 个 程序 。 
指令 选择 可 以 通过 一 个 树 重 写 过 程 完 成 。 在 这 个 过 程 中 , 对 应 于 机 器 指令 的 树 模 式 被 用 
来 逐步 覆盖 一 棵 语法 树 。 我 们 可 以 把 树 重 写 规则 和 相应 的 指令 代价 关联 起 来 ,并 应 用 动 
态 规划 技术 来 为 多 种 类 型 的 机 器 和 表达 式 生成 最 优 的 覆盖 方式 。 

Ershov 数 指出 了 如 果 不 把 任何 临时 值 保存 回 内 存 中 , 对 一 个 表达 式 求 值 需要 多 少 个 寄 
FAF o 
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。 溢出 代码 是 二 个 把 某 个 寄存 器 中 的 值 保存 到 内 存 中 的 指令 序列 。 这 些 指令 的 目的 是 在 寄 
存 器 中 腾 出 空间 , 以 保存 男 一 个 值 。 
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第 9 章 ， 机 器 无 关 优 化 


如 果 我 们 简单 地 把 每 个 高 级 语言 结构 独立 地 翻译 成 为 机 器 代码 ， 那么 会 带 来 相当 大 的 运行 时 刻 
的 开销 。 本 章 讨论 如 何 消除 这 样 的 低 效率 因素 。 在 目标 代码 中 消除 不 必要 的 指令 , 或 者 把 一 个 指令 
序列 替换 为 一 个 完成 同样 功能 的 较 快 的 指令 序列 , 通常 被 称 为 “代码 改进 ”或 者 “代码 优化 o 

局 部 代码 优化 (在 一 个 基本 块 内 改进 代码 ) 的 相关 知识 已 经 在 8.5 节 介 绍 过 了 。 本 章 将 处 理 
全 局 代码 优化 问题 。 在 全 局 优化 中 ， 代码 的 改进 将 考虑 在 多 个 基本 块 内 发 生 的 事情 。 我 们 将 在 
9.1 节 中 讨论 一 些 主要 的 代码 改进 机 会 。 

大 部 分 全 局 优化 是 基于 数据 流 分 析 (data-flow analyse) 技术 实现 的 。 数据 流 分 析 技 术 是 一 组 
用 以 收集 程序 相关 信息 的 算法 。 所 有 数据 流 分 析 的 结果 都 具有 相同 的 形式 : 对 于 程序 中 的 每 个 
指令 , 它们 描述 了 该 指令 每 次 执行 时 必然 成 立 的 一 些 性 质 。 不 同性 质 的 分 析 方 法 各 不 相同 。 比 
如 , 对 于 常量 传播 分 析 而 言 , 要 判断 在 程序 的 每 个 点 上 ， 程序 使 用 的 各 个 变量 是 否 在 该 点 上 具有 
唯一 的 常量 值 。 比 如 ， 这 个 信息 可 以 用 于 把 变量 引用 替换 为 常量 值 。 另 一 个 例子 是 ， 活跃 性 分 析 
确定 在 程序 的 每 个 点 上 ， 在 某 个 变量 中 存放 的 值 是 否 一 定 会 在 被 读 取 之 前 被 覆盖 掉 。 如 果 是 ， 我 
们 就 不 需要 在 寄存 器 或 内 存 位置 上 保留 这 个 值 。 

我 们 将 在 9. 2 节 介 绍 数据 流 分 析 技术 。 其 中 还 包括 几 个 重要 的 例子 ; 说 明 我 们 如 何 使 用 在 全 
局 范围 内 收集 到 的 信息 来 改进 代码 。9. 3 节 将 介绍 一 个 数据 流 框架 的 总 体 思想 ,9.2 节 中 的 数据 
流 分 析 技 术 是 这 个 框架 的 特例 。 我 们 实际 上 可 以 使 用 同一 个 算法 来 解决 这 些 数据 流 分 析 的 实例 。 
我 们 还 能 够 度量 这 些 算法 的 性 能 ， 并 且 证 明 它们 对 所 有 分 析 技术 的 实例 而 言 都 是 正确 的 。9. 4 节 
是 总 体 框架 的 一 个 例子 , 它 的 分 析 功 能 比 前 面 的 例子 更 强大 。 然 后 ， 我 们 将 在 9. 5 节 中 考虑 一 个 
被 称 为 “部 分 宛 余 消除 ”的 功能 强大 的 技术 。 这 个 技术 可 用 于 优化 程序 中 各 个 表达 式 求 值 的 位 置 。 
这 个 问题 的 解决 方案 由 不 同 的 数据 流 分 析 问 题 的 解决 方案 通过 组 合 而 得 到 。 

在 9.6 节 , 我们 将 讨论 程序 中 循环 的 发 现 和 分 析 。 对 循环 的 识别 引 出 了 另 一 个 用 来 解决 数据 
流 问 题 的 算法 族 。 这 些 算法 基于 一 个 结构 良好 的 ( 即 可 归 约 的 ) 程序 中 的 循环 的 层次 结构 。 这 个 
处 理 数 据 流 分 析 的 方法 将 在 9.7 节 中 讨论 。 最 后 , 在 9.8 节 中 将 使 用 层次 化 分 析 来 消除 归纳 变量 
(归纳 变量 本 质 上 就 是 用 来 对 循环 的 迭代 次 数 进行 计数 的 变量 ) 。 这 种 代码 改进 是 我 们 能 够 对 那 
些 由 常用 程序 设计 语言 书写 的 程序 所 做 的 最 重要 的 改进 之 一 。 


9.1 优化 的 主要 来 源 


编译 器 的 优化 必须 保持 源 程序 的 语义 。 除 了 一 些 非常 特殊 的 场合 之 外 ， 一 旦 程序 员 选 择 并 
实现 了 某 种 算法 ， 编译 器 不 可 能 完全 理解 这 个 程序 并 把 它 蔡 换 为 一 个 全 然 不 同 且 更 加 高 效 的 等 
价 算法 。 编 译 器 只 知道 如 何 应 用 一 些 相 对 低层 的 语义 转换 。 在 进行 转换 时 ， 编译 器 用 到 一 些 常 
见 的 性 质 , 比如 像 i+0 = i 这 样 的 代数 恒等式 或 使 用 一 些 程序 语义 (如 在 同样 的 值 上 进行 同样 的 
运算 必然 得 到 同样 的 结果 ) 。 

9.1.1 宛 余 的 原因 

在 一 个 典型 的 程序 中 会 存在 很 多 完 余 的 运算 。 有 时 , 在 源 代码 中 会 用 到 元 余 。 比 如 ,程序 员 
可 能 发 现 重新 计算 某 些 结果 会 更 为 直接 和 方便 ,而 让 编译 器 去 发 现实 际 上 只 需要 进行 一 次 这 样 
的 计算 。 但 更 多 的 时 候 , 宛 余 性 是 使 用 高 级 程序 设计 语言 编程 的 副产品 。 在 大 部 分 程序 设计 语 
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言 (不 包含 C 或 者 C++，, 它们 允许 对 指针 进行 算术 运算 ) 中 , 程序 员 别 无 选择 ， 只 能 使 用 类 似 于 
ALi] Lj] Xf 1 的 方式 来 访问 一 个 数组 的 元 素 或 一 个 结构 的 字段 。 

当 一 个 程序 被 编译 后 , 每 一 个 这 样 的 高 层 数 据 结构 访问 都 会 被 扩展 成 为 多 个 低层 次 的 算术 
运算 ,比如 计算 一 个 矩阵 4 的 第 (i, 让 个 元 素 的 位 置 的 运算 。 对 同一 个 数据 结构 的 访问 通常 共享 
了 很 多 公共 的 低层 运算 。 程 序 员 不 知道 这 些 低层 运算 , 因此 不 能 自己 去 消除 这 些 元 余 。 实 际 上 ， 
从 软件 工程 的 角度 看 , 程序 员 只 通过 数据 元 素 的 高 层 名 字 来 访问 它们 是 比较 好 的 做 法 。 这 样 , 程 
序 容易 书写 , 并 且 更 重要 的 是 , 程序 更 容易 理解 和 演化 。 通 过 让 一 个 编译 器 来 消除 这 些 元 余 , 我 
们 在 两 个 方面 都 得 到 了 最 好 的 结果 : 程序 不 仅 高 效 而 且 易于 维护 。 

9.1.2 一 个 贯穿 本 章 的 例子 :快速 排序 

接 下 来 , 我 们 将 使 用 被 称 为 快速 排序 (quicksort) 的 排序 程序 的 片断 来 说 明 儿 个 重要 的 可 以 改 
进 代码 的 转换 。 在 图 9-1 中 的 C 程序 是 从 Sedgewick oA AGRI, 它 讨 论 了 如 何 对 这 样 一 个 程序 
进行 手工 优化 。 我 们 将 不 会 在 这 里 讨论 这 个 程序 在 算法 方面 的 所 有 精妙 细节 ,比如 , al0] 必 然 
存放 着 已 经 排 好 序 的 元 素 的 最 小 者 , 而 a[ max] 则 存放 最 大 的 元 素 。 






















void quicksort(int m, int n) 
/* 递归 地 对 a[m] 和 a[n] 之 间 的 元 素 排 序 */ 
{ 
int is 53 
int Ts Fs 
if (n <= m) return; 
/* 片断 由 此 开始 */ 
i=m-1; j =n; v = aln); 
while (1) { 
do i = it1; while (ali] < v); 
do j = j-1; while (alj] > v); 
if (i >= j) break; 
x = ali]; a[i] = a[j]; alj] = x; /* 对 换 a[i] 和 a[j]*/ 
} 
x = ali]; ali] = a[n]; a[n] = x; /* 对 换 a[i] 和 a[n] */ 
/* 片断 在 此 结束 */ 


quicksort(m,j); quicksort (it1,n); 





图 9-1 快速 排序 算法 的 C 代码 


在 我 们 可 以 优化 掉 地 址 计算 中 的 元 余 之 前 , 程序 中 的 地 址 运算 首先 必须 被 分 解 成 为 低层 次 
的 算术 运算 , 这 样 才能 暴露 出 宛 余 之 处 。 在 本 章 的 其 余部 分 ,我们 假设 中 间 表 示 形 式 由 三 地 址 语 
名 组 成 , 其 中 所 有 的 中 间 表 达 式 的 结果 都 由 临时 变量 来 存放 。 在 图 9-1 中 标记 出 的 程序 片断 的 中 
间 代 码 显示 在 图 92 中 。 

在 这 个 例子 中 , 我 们 假设 整数 占用 4 个 字 节 。 赋 值 运算 x=a[i] 按 照 6.4.4 节 中 的 方法 被 


类 似 地 , alj] =x 变 成 了 第 (20) 和 (21) 步 , 即 
t10 = 4*j 
a[t10] = x 


请 注意 , 在 原 程序 中 的 每 个 数组 访问 都 被 翻译 成 为 一 对 语句 , 其 中 包含 一 个 乘法 和 一 个 数组 下 标 





© R. Sedgewick, “Implementing Quicksort Programs” , Comm. ACM, 21, 1978, pp. 847-857. 


376 PIF 





运算 。 结 果 , 这 个 短 短 的 程序 片断 被 翻译 成 为 一 个 相当 长 的 三 地 址 运算 序列 。 


m-1 t7 = 4*i 
n t8 = 4*j 
1 = 4*n t9 = alts] 
alti] a[t7] = t9 
+1 £10 = 44} 
2 = 4*i alti0] = x 
t3 = a[t2] goto (5) 
if t3<v goto (5) $11 =°4*i 


j js x = a[ti1] 
t4 = 4*j t12 = 4*i 

t5 = a[t4] t13 = 4*n 

if t5>v goto (9) tl4 = a[t13] 
if i>=j goto (23) a[ti2] = t14 
t6 = 4*i t15 =) 4*n 

x = a[t6] a[t15] = x 





图 9-2 图 9-1 中 程序 片断 的 三 地 址 代码 


图 9-3 是 图 9-2 中 的 程序 的 流 图 。 基 本 块 8 是 其 人 口 结 点 。8.4 节 介 绍 过 , 图 9-2 中 所 有 的 
条 件 和 无 条 件 跳 转 语句 的 目标 在 图 9-3 中 都 被 替换 为 以 它们 的 目标 语句 为 首 语句 的 基本 块 。 在 
图 9-3 中 有 三 个 循环 。 基 本 块 B, 和 Bs 本 身 就 是 循环 。 基 本 块 B,、B3、B4、Bs 一 起 组 成 了 一 个 
循环 , 其 中 B, 是 唯一 的 入口 结 点 。 


i=ml By 
J= n 

tl = 4*n 

v= a[tl} 












i = itl B, 
t2 = 4*i 
t3 = a[t2) 






if t3<v goto B, 













tll = 4*i 
x = a[tll] 
t12 = 4*i 
t13 = 4*n 
t14 = a[t13] 
a[t12] = t14 
t15 = 4*n 
a[t15] =x 


6 

























图 9-3 ”快速 排序 代码 片断 的 流 图 
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9.1.3 “保持 语义 不 变 的 转换 

编译 器 可 以 使 用 很 多 种 方法 改进 一 个 程序 , 但 不 改变 程序 所 计算 的 函数 。 公 共 子 表达 式 消除 、 
复制 传播 、 死 代码 消除 和 常量 折叠 都 是 这 样 的 函数 不 变 (或 者 说 语义 不 
变 ) 转 换 的 常见 例子 。 我 们 将 逐一 介绍 这 些 方法 。 

一 个 程序 中 经 常 包含 对 同一 个 值 的 多 次 计算 ,比如 计算 数组 中 的 偏 
移 量 。9. 1. 2 节 提 到 过 , 某 些 这 样 的 重复 计算 不 可 能 由 程序 员 来 避免 , 因 
为 这 些 计算 过 程 处 于 可 在 源 语言 中 处 理 的 细节 的 更 下 层 。 比 如 , 在 图 9- 
da 中 显示 的 基本 块 By 中 对 4*i 和 4*j 进 行 了 重复 计算 , 尽管 这 些 计算 
全 都 不 是 程序 员 显 式 要 求 的 。 

9.1.4 全 局 公共 子 表达 式 

如 果 表达 式 在 某 次 出 现 之 前 已 经 被 计算 过 , 并 且 E 中 变量 的 值 从 
那 次 计算 之 后 就 一 直 没 被 改变 , 那么 的 该 次 出 现 就 称 为 一 个 公共 子 表 | sftel -te 
ik A (common subexpression)。 如 果 将 E 的 上 一 次 计算 结果 赋予 变量 x, on z 
E x 的 值 在 中 间 没有 被 改变 S ,那么 我 们 就 可 以 使 用 前 面 计算 得 到 的 值 ， : 
从 而 避免 重新 计算 E。 
在 图 9-4a 中 对 t7 和 t10 的 赋值 分 别 计算 了 公共 子 表达 式 。 图 9-4 局 部 公共 子 
4* i 和 4*j 这 些 步骤 已 经 在 图 9-4b 中 被 消除 了 。 消 除 后 的 代码 使 用 表达 式 消除 
t6 来 替代 t 上 7， 使 用 t8 来 蔡 代 t10。 口 
图 9-5 显示 了 从 图 9-3 中 流 图 的 基本 块 B; 和 By 中 消除 全 局 和 局 部 公共 子 表达 式 之 后 
的 结果 。 我 们 首先 讨论 对 Bs 的 转换 , 然后 再 讨论 一 些 和 数组 相关 的 精妙 之 处 。 

如 图 9-4b 所 示 , 在 消除 局 部 公共 子 表达 式 之 后 , Bs 仍然 对 4*i 和 4*j 进行 求 值 。 它 们 都 是 
公共 子 表达 式 。 更 明确 地 讲 , 使 用 在 B 中 计算 得 到 的 4 的 值 ，Bs 中 的 三 个 语句 


t8 = 4*j 
t9 = alts] 
a[t8] = x 


可 以 替换 为 
t9 = a[t4] 
a[t4] = x 


观察 一 下 图 9-5, 我 们 会 发 现 当 控制 流 从 Bs 中 计算 4 *7 的 点 传递 到 Bs 中 时 ,了 和 去 的 值 都 没有 
改变 。 因 此 , 当 需 要 4 *7 时 可 以 使 用 长 来 替代 。 

EH A HR 18 之 后 , By 中 的 另 一 个 公共 子 表达 式 就 显露 出 来 了 。 MNF RARE alt], 
对 应 于 源 代码 层次 上 的 值 cLj] 。 当 控制 流离 开 B3 进入 Bs 时, 不 仅仅 i 保留 了 它 的 值 , alj] 也 保 
留 了 原来 的 值 。 这 个 值 在 计算 出 来 之 后 保存 到 临时 变量 5 中 。 因 为 中 间 没 有 对 数组 a 中 元 素 的 
赋值 , 因此 a[j] 的 值 不 变 。B; 中 的 语句 


t9 = a[t4] 
a[t6] = t9 


可 以 被 替换 为 


a[t6] = t5 


类 似 地 , 可 以 看 出 图 9-4b 的 基本 块 Bs HIRA x 的 值 和 B, FIRZA 3 的 值 相 同 。 图 9-5 中 的 





b) 消除 之 后 





9” 即使 x 被 改变 , 如 果 我 们 把 EE 的 计算 结果 同时 赋值 给 变量 x 和 另 一 个 新 的 变量 y, 我 们 仍然 可 以 用 y 来 替代 对 EE 
的 计算 , 从 而 复 用 该 计算 过 程 。 
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B, 是 从 图 9-4b 的 Bs 中 消除 了 与 源 代 码 级 表达 式 c[ 训 和 a[ 门 值 对 应 的 公共 子 表达 式 之 后 的 结 
果 。 对 于 图 9-5 中 的 By 也 进行 了 一 系列 类 似 的 转换 。 

图 9-5 的 B, Al By 中 的 表达 式 a[ 红 ] 不 被 认为 是 公共 子 表达 式 ， 虽然 在 这 两 个 地 方 都 可 以 使 
用 红 。 在 控制 流离 开 B, 到 达 By 之 前 , 它 还 可 能 经 过 Bs, 而 Bs 中 存在 对 a 的 赋值 。 因 此 , altl] 
到 达 By 时 的 值 可 能 和 它 离开 B 时 的 值 有 所 不 同 。 把 olil ] 作为 一 个 公共 子 表达 式 是 不 安全 的 。 






















B 
By 
Ly) 
tS = alt2i 
if t3<v goto B, 
Ie Ja B, 
t4 = 4*j 
t5 = a[t4] 
if t5>v gotoB, | 
if i>=j gotoB, B, 


















x= t3 
a[t2] = tS 
a(t4]) =x 
goto B, 





t14 = a[tl] 
a[t2] = t14 
a[tl] = x 











图 9-5 ”经 过 公共 子 表达 式 消除 之 后 的 Bs 和 Be 


9.1.5 ,复制 传播 

19-5 中 的 基本 块 B 可 以 通过 使 用 两 个 新 转换 来 消除 *, 从 而 得 到 进一步 改进 。 其 中 的 一 个 
转换 考虑 形 如 u=v 的 赋值 表达 式 ; 这 种 表达 式 被 称 为 复制 语句 (copy [a= are] [b= de 
statement) , 或 者 简称 复制 。 只 要 我 们 更 加 细致 地 考虑 例 9.2, 很 快 就 
会 发 现 一 些 复制 语句 。 因 为 常用 的 公共 子 表达 式 消除 算法 会 引入 这 些 le = wal 
复制 语句 ,其 他 一些 优化 算法 也 会 引 和 这样 的 语句 。 a) 
为 了 消除 图 9-6a 中 的 公共 子 表达 式 语句 c = a + e, 我 们 必 IE nEs 
须 使 用 新 的 变量 :来 存放 d+e 的 值 。 在 图 9-6b H, 赋 给 变量 c 的 是 变 
量 ; 的 值 , 而 不 是 表达 式 d +e 的 值 。 因 为 控制 流 可 能 经 过 对 a 的 赋值 
到 达 语 名 < <b +e 处 , 也 可 能 经 过 对 4 的 赋值 到 达 这 里 , 因此 把 c = b) 

















d +e 替换 为 c =a 或 c =b 都 是 不 正确 的 。 E 
隐藏 在 复制 传播 转换 之 后 的 基本 思想 是 在 复制 语句 u =v 之 后 尽 
可 能 地 用 "来 替代 vv。 比如, 图 9-5 的 基本 块 B; 中 的 赋值 语句 x =t3 


9-6 在 公共 于 
表达 式 消除 过 程 中 
引入 的 复制 语句 


机 器 无 关 优 化 379 


是 一 个 复制 语句 。 把 复制 传播 应 用 于 Bs 会 生成 图 9-7 中 的 代码 。 这 个 改变 看 起 来 可 能 不 像 是 一 
个 改进 , 但 是 ,正如 我 们 将 在 % 1.6 节 看 到 的 ,， 它 给 也 我 们 消除 对 x 赋值 的 EE 
语句 的 机 会 。 alal t5 


a[t4] = t3 


9i i6 死 代码 消除 goto By 





如 果 一 个 变量 在 某 一 程序 点 上 的 值 可 能 会 在 以 后 被 使 用 , 那么 我 们 就 a 
说 这 个 变量 在 该 点 上 活路 (live)。 否则， 它 在 该 点 上 就 是 死 的 (dead)。 与 we Mia 
此 相关 的 一 个 想法 就 是 死 (或 者 说 无 用 ) 代码 。 所 谓 死 代 码 就 是 其 计算 结果 ”传播 转换 后 


永远 不 会 被 使 用 的 语句 。 程 序 员 不 大 可 能 有 意 引入 死 代 码 ， 死 代码 多 半 是 “，， 基 本 块 柬 
因为 前 面 执行 过 的 某 些 转换 而 造成 的 。 

UREI ERE debug 在 程序 的 不 同 点 上 被 设置 为 TRUE 或 者 FALSE, 并 在 如 下 的 语句 中 
使 用 


if (debug) print --- 

Sie ais FT RE EA HES SER: 每 次 程序 运行 到 这 个 语句 时 ，depug 的 值 都 是 FALSE, 
通常 ,出 现 这 种 情况 的 原因 是 不 管 程序 实际 上 沿 着 什么 分 支 运行 , 在 测试 debug 的 取 值 之 前 的 
最 后 一 个 对 debug 赋值 的 语句 总 是 : 


debug = FALSE 
如 果 复 制 传播 把 debug FRA FALSE, 那么 因为 print 语句 不 可 能 被 运行 到 , 所 以 它 就 成 为 死 
代码 。 我 们 可 以 把 这 个 测试 和 print 语句 从 目标 代码 中 全 部 消除 。 更 加 一 般 地 讲 , 如果 在 编译 时 
刻 推 导出 一 个 表达 式 的 值 是 常量 , 就 可 以 使 用 该 常量 来 替代 这 个 表达 式 。 这 个 技术 被 称 为 常量 
È, 四 | 
复制 传播 的 好 处 之 一 就 是 它 经 常 把 一 些 复制 语句 变 成 死 代码 。 比 如 , 先进 行 复制 传播 再 进 
行 死 代码 消除 就 可 以 去 掉 图 9-7 的 代码 中 对 x 的 赋值 ， 并 将 其 转换 成 为 


a[t2] = t5 
a[t4] = t3 
goto By 


这 个 代码 是 对 图 9-5 中 的 基本 块 B5 的 进一步 改进 。 
9.1.7 ”代码 移动 

对 于 优化 工作 而 言 ,循环 (尤其 内 部 循环 ) 是 一 个 重要 的 地 方 。 因 为 程序 往往 会 将 它们 的 大 
部 分 运行 时 间 花 费 在 循环 上 。 如 果 我 们 减少 一 个 内 部 循环 中 的 指令 个 数 , 即使 因此 增加 了 该 循 
环 外 的 代码 , 程序 的 运行 时 间 也 可 以 减少 。 

减少 循环 内 部 代码 数量 的 一 个 重要 改动 是 代码 移动 (code motion) 。 这 个 转换 处 理 的 是 那些 
不 管 循环 执行 多 少 次 都 得 到 相同 结果 的 表达 式 ( 即 循环 不 变 计算 ), 在 进入 循环 之 前 就 对 它们 求 
值 。 请 注意 ,“ 在 循环 之 前 ”的 说 法 假设 了 存在 一 个 循环 人 口 。 所 谓 循环 入口 就 是 一 个 基本 块 ， 
所 有 循环 外 部 到 循环 的 跳 转 指令 都 以 它 为 目标 ( 见 8.4.5 节 )。 
DEE 在 下 面 的 weile 语句 中 ,对 limit -2 的 求 值 是 一 个 循环 不 变 计算 : 

while (i <= limit-2) /* 不 改变 limit 值 的 语句 */ 
进行 代码 移动 之 后 将 得 到 如 下 的 等 价 代码 : 


t = limit-2 
while (i <= t) /* 不 改变 1imit 或 t 值 的 语句 */ 


现在 , limit -2 的 计算 只 在 进入 循环 之 前 被 执行 一 次 。 之 前 , 如 果 我 们 重复 循环 体 n 次 , 就 
会 对 limit -2 计算 n+1 次 。 fay 
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9. 1.8” 归 纳 变量 和 强度 消减 

另 一 个 重要 的 优化 是 在 循环 中 找到 归纳 变量 并 优化 它们 的 计算 。 对 于 一 个 变量 *， 如果 存在 
一 个 正 的 或 负 的 常数 。 使 得 每 次 x 被 赋值 时 它 的 值 总 是 增加 c, 那么 x 就 称 为 “归纳 变量 " 。 比 如 ， 
在 图 9.5 中 , i 和 忆 都 是 By 组 成 的 循环 中 的 归纳 变量 。 归 纳 变量 可 以 通过 每 次 迭代 进行 一 次 简 
单 的 增 量 运算 (加 法 或 减法 ) 来 计算 。 把 一 个 高 代价 的 运算 (比如 乘法 ) 鞭 换 为 一 个 代价 较 低 的 运 
算 ( 比如 加 法 ) 的 转换 被 称 为 强度 消减 (strength reduction) 。 但 是 归纳 变量 不 仅 允 许 我 们 在 适当 的 
时 候 进行 强度 消减 优化 ; 在 我 们 沿 着 循环 运行 时 ， 如果 有 一 组 归纳 变量 的 值 的 变化 保持 步调 一 
Be, 我 们 常常 可 以 将 这 组 变量 删 剩 二 个 。 

在 处 理 循环 时 , 按照 “从 里 到 外 ”的 方式 进行 工作 是 很 有 用 的 。 也 就 是 说 , 我 们 应 该 从 内 部 循环 开 
始 , 然后 逐步 处 理 较 大 的 外 围 循环 。 这 样 , 我 们 将 看 到 这 个 优化 是 如 何 从 最 内 层 的 循环 之 一 ( 即 Ba) 开 
始 被 应 用 到 我 们 的 快速 排序 例子 中 的 。 请 注意 , ; 和 4 的 值 的 步调 保持 一 致 ; 因为 4 *j 被 赋 给 要 ,每 次 
j 的 值 减少 1 时 4 的 值 就 减少 4。 变 量 ) 和 妇 就 形成 了 一 个 很 好 的 归纳 变量 对 的 例子 。 

当 一 个 循环 中 存在 两 个 或 更 多 的 归纳 变量 时 ， 有 可 能 只 留 下 一 个 而 删除 其 他 的 变量 a 对 于 
图 9.5 中 的 内 层 循环 By, 我 们 不 能 把 j 或 44 ZANR. 14 在 By 中 使 用 , 而 j 在 B4 中 使 用 。 但 是 ， 
我 们 可 以 用 这 个 例子 来 说 明 强度 消减 优化 以 及 归纳 变量 消除 的 部 分 过 程 。 当 考虑 由 By. Bs, By, 
Bs 组 成 的 外 层 循环 时 , | 最 终 会 被 消除 。 
在 图 9.5 中 , 关系 不 24 *j HEM A 赋值 之 后 一 定 成 立 , 并 且 妇 没有 在 内 层 循环 B 中 的 其 
他 地 方 被 改变 , 这 意味 着 关系 44=4 *j+4 在 紧 跟 语句 j=j -1 之 后 必然 成 立 。 因 此 我 们 可 以 用 14 = 
4 -4 来 替代 赋值 语句 4 =4*j。 唯 一 的 问题 是 在 我 们 第 一 次 进入 基本 块 B 时 , 4 还 没有 值 。 

因为 我 们 必须 在 进入 基本 块 B; 的 时 候 保 证 关系 4 =4 *j 成 立 , 所 以 在 初始 化 j 本 身 的 基本 块 
的 尾部 放置 了 一 个 对 4 的 初始 化 语句 。 这 个 语句 在 图 9-8 中 以 附加 在 基本 块 B 上 的 虚线 框 表示 。 

















t3 = a[t2] 
if t3<v gotoB, 






j= 5-1 
t4 = t4-4 
t5 = a[t4] 
if t5>v goto B, 


x = t3 Be 
a[t2] = t5 
a[t4] = x 
goto B, 













Tt ai 


图 9-8 对 基本 块 B 中 的 4*7 应 用 强度 消减 优化 
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虽然 我 们 增加 了 一 个 指令 , 但 是 它 只 会 在 基本 块 Bi 中 执行 一 次 。 只 要 乘法 运算 比 加 法 或 者 减法 
需要 更 多 的 时 间 , 那么 把 一 个 乘法 运算 替换 为 减法 运算 就 能 加 快 目 标 代码 的 执行 速度 。 而 这 个 
结论 在 很 多 机 器 上 都 成 立 。 口 
我 们 用 另 一 个 归纳 变量 消除 的 例子 来 结束 本 节 5 在 这 个 例子 中 ; 我 们 将 在 包含 了 Bj、 B. B 
和 Bs 的 外 层 循环 中 处 理 ; 和 j。 
在 强度 消减 优化 被 应 用 到 分 别 环绕 By. By 的 两 个 内 部 循环 之 后 , i 和 ;的 唯 二 用 途 是 
计算 基本 块 B4 中 的 测试 的 结果 。 我 们 知道 i 和 忆 的 值 满足 关系 这 =4 xi 而 j 和 的 值 满足 关 
RA=4j. 因此 , Wik i=j 可 以 被 替换 为 有 2 二 4。 一 旦 进行 这 个 替换 ，B, 中 的 i 和 B 中 的 7 就 
变 成 了 死 变 量 , 而 在 这 些 基本 块 中 对 它们 的 赋值 就 变 成 了 可 以 删除 的 死 代 码 。 最 后 得 到 的 流 图 
如 图 9-9 所 示 。 O 









t2 = t2+4 
t3 = a[t2] 
if t3<v goto B, 













t4 = t4-4 
t5 = a[t4] 
if t5>v gotoB, 























a[t2] = t5 
a[t4] = t3 
goto B 2 


t14 = a[tl] 
a[t2] = t14 
af[tl] = t3 






图 9-9 ”归纳 变量 消除 之 后 的 流 图 


我 们 已 经 讨论 的 代码 改进 转换 都 是 很 有 效 的 。 和 图 9-3 中 原来 的 流 图 相 比 ; 图 9-9 中 基本 块 
B, 和 Bs 中 的 指令 数目 由 4 条 减少 为 3 条 ; Bs 中 的 指令 数目 由 9 条 减少 到 3 条 , 而 Be 中 的 指令 
数目 由 8 条 减少 到 3 条 。 确实, By 中 的 指令 从 4 条 指令 增长 为 6 条 指令 , 但 是 在 这 个 代码 片断 中 
By 只 被 执行 一 次 , 因此 总 的 运行 时 间 几 乎 不 会 受到 Bi 的 大 小 的 影响 。 
9.1.9 91 节 的 练习 


练习 9. 1.1: 对 于 图 9-10 中 的 流 图 : 

1) 找 出 流 图 中 的 循环 。 

2) By 中 的 语句 (1) 和 (2) 都 是 复制 语句 。 HEP a Mb 都 被 赋予 了 常量 值 。 我 们 可 以 对 a M b 
的 哪些 使 用 进行 复制 传播 ， 并 把 对 它们 的 使 用 蔡 换 为 对 一 个 常量 的 使 用 ? 在 所 有 可 能 的 地 方 进 
行 这 种 替换 。 

3) 对 每 个 循环 , 找 出 所 有 的 全 局 公共 子 表达 式 。 
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4) 寻找 每 个 循环 中 的 归纳 变量 。 同 时 要 考虑 在 (2) 中 引入 的 所 有 常量 。 

5) 寻找 每 个 循环 的 全 部 循环 不 变 计 算 。 

练习 9. 1.2: 把 本 节 中 的 转换 技术 应 用 到 图 8-9 中 的 流 图 上 。 

练习 9. 1.3; 把 本 节 中 的 转换 应 用 到 练习 8.4.1 和 练习 8.4.2 中 得 到 的 流 图 中 去 。 

练习 9. 1.4: 图 9-11 中 是 用 来 计算 两 个 向 量 4 和 8B 的 点 积 的 中 间 代 码 。 尽 你 所 能 , 通过 下 列 
方式 优化 这 个 代码 ; 消除 公共 子 表达 式 ; 对 归纳 变量 进行 强度 消减 ,消除 归纳 变量 。 










(3) c = atb 
(4) d = c-a 








if i<n goto L 


图 9-10 练习 9.1.1 的 流 图 图 9-11 计算 点 积 的 中 间 代 码 


9.2 ”数据 流 分 析 简 介 


在 9.1 节 中 介绍 的 所 有 优化 都 依赖 于 数据 流 分 析 。“ 数 据 流 分 析 ” 指 的 是 一 组 用 来 获取 有 关 
数据 如 何 沿 着 程序 执行 路 径流 动 的 相关 信息 的 技术 。 比 如 , 实现 全 局 公共 子 表达 式 消除 的 方法 
之 一 要 求 我 们 确定 在 程序 的 任何 可 能 执行 路 径 上 , 两 个 在 文字 上 相同 的 表达 式 是 否 会 给 出 相同 
的 值 。 另 一 个 例子 是 , 如 果 某 一 个 赋值 语句 的 结果 在 任何 后 续 的 执行 路 径 中 都 没有 被 使 用 , 那么 
我 们 可 以 把 这 个 赋值 语句 当 作 死 代 码 消除 。 这 些 以 及 很 多 其 他 重要 问题 , 都 可 以 通过 数据 流 分 
析 来 回答 。 

9.2.1 数据 流 抽象 

从 二 6.2 节 中 可 知 , 程序 的 执行 可 以 看 作 是 对 程序 状态 的 一 系列 转换 。 程 序 状态 由 程序 中 的 
所 有 变量 的 值 组 成 , 同时 包括 运行 时 刻 栈 的 栈 顶 之 下 各 个 栈 帧 的 相关 值 。 一 个 中 间 代 码 语句 的 
每 次 执行 都 会 把 一 个 输入 状态 转换 成 一 个 新 的 输出 状态 。 这 个 输入 状态 和 处 于 该 语句 之 前 的 程 
序 点 相关 联 , 而 输出 状态 和 该 语句 之 后 的 程序 点 相关 联 。 

当 我 们 分 析 一 个 程序 的 行为 时 , 我 们 必须 考虑 程序 执行 时 可 能 采取 的 各 种 通过 程序 的 流 图 
的 程序 点 序列 (“ 路 径 ” ) 。 然 后 我 们 从 各 个 程序 点 上 可 能 的 程序 状态 中 抽取 出 需要 的 信息 ， 用 以 
解决 特定 数据 流 分 析 问 题 。 在 更 加 复杂 的 分 析 中 , 我 们 必须 考虑 调用 和 返回 执行 时 会 形成 在 不 
同 过 程 的 流 图 之 间 跳 转 的 路 径 。 但 是 ,在 我 们 刚 开始 研究 的 时 候 , 我 们 将 关注 穿越 单个 过 程 的 单 
个 流 图 的 路 径 。 

让 我 们 看 一 下 流 图 会 给 出 哪些 关于 可 能 执行 路 径 的 信息 。 

。 在 一 个 基本 块 内 部 , 一 个 语句 之 后 的 程序 点 和 它 的 下 一 个 语句 之 前 的 程序 点 相同 。 
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。 如 果 有 一 个 从 基本 块 B 到 基本 块 B, 的 边 ; 那么 By 的 第 一 个 语句 之 前 的 程序 点 可 能 紧 跟 
在 Bi 的 最 后 一 个 语句 后 的 程序 点 之 后 。 

这 样 , 我 们 可 以 把 从 点 pi 到 点 p。 的 一 个 执行 路 径 (exeution path, 简称 路 径 ) 定 义 为 满足 下 列 
条 件 的 点 的 序列 py po s Pat WP 1, 2,0, nal: 

1) 要 么 pi 是 紧 靠 在 一 个 语句 前 面 的 点 , 且 pi;,1 是 紧 跟 在 该 语句 后 面 的 点 。 

2) BA pi 是 某 个 基本 抉 的 结尾 ， 且 p;,1 是 该 基本 抉 的 一 个 后 继 基本 块 的 开头 。 

一 般 来 说 ,一 个 程序 有 无 穷 多 条 可 能 的 执行 路 径 , 执行 路 径 的 长 度 并 没有 上 界 。 程 序 分 析 把 
可 能 出 现在 某 个 程序 点 上 的 所 有 程序 状态 总 结 为 有 穷 的 特性 集合 。 不 同 的 分 析 技术 可 以 选择 抽 
象 掉 不 同 的 信息 ,， 并且- 一 般 来 说 , 没有 哪个 分 析 会 给 出 状态 的 完全 表示 。 

DEE 即使 是 图 9-12 中 的 简单 程序 也 描述 了 无 限 多 个 执行 路 径 。 最 短 的 完全 执行 路 径 由 程 
序 点 (1, 2, 3, 4, 9) 组 成 , 它 不 进入 任何 循环 。 次 vena eae k 
短 的 路 径 执 行 一 次 循环 , 它 由 程序 点 (1, 2, 3, 4， Q) 

5, 6,7, 8, 3, 4, 9) 组 成 。 在 这 个 例子 中 , 我 们 知 
道 在 第 一 次 执行 程序 点 (5) 时 , 因为 di 的 定 值 , a 
的 值 必然 是 1。 我 们 说 di 在 第 一 次 迭代 的 时 候 到 
达 了 点 (5) 。 在 其 后 的 迭代 中 , d 到 达 了 点 (5)， 
a 的 值 是 243。 u 

一 般 来 说 , 跟踪 所 有 路 径 上 的 所 有 程序 状态 
是 不 可 能 的 。 在 数据 流 分 析 中 , 我们 并 不 区 分 到 
达 一 个 程序 点 的 路 径 之 间 的 差异 。 此 外 , 我 们 并 
不 眼 踪 整 个 状态 , 而 是 抽象 控 某 些 细节 ,只 保留 进 。。 图 9.12 说 明 数据 流 抽 象 的 例子 程序 
行 分 析 所 需要 的 数据 。 下 面 的 两 个 例子 将 说 明 一 
个 程序 点 上 的 同一 个 状态 可 以 导出 不 同 的 抽象 信息 。 

1) 为 了 帮助 用 户 调试 他 们 的 程序 , 我 们 可 能 希望 找 出 在 某 个 程序 点 上 一 个 变量 可 能 有 哪些 
值 , 以 及 这 些 值 可 能 在 哪里 定 值 。 比 如 , 我 们 可 能 对 在 程序 点 (5) 上 的 所 有 程序 状态 进行 如 下 总 
结 : a 的 值 总 是 |1, 243) 中 的 一 个 , 而 它 由 | di, ds| 中 的 一 个 定 值 。 可 能 沿 着 某 条 路 径 到 达 某 个 
程序 点 的 定 值 称 为 到 达 定 值 (reaching definition) 。 

2) 假设 我 们 感 兴趣 的 不 是 到 达 定 值 , 而 是 常量 折 释 的 实现 。 如 果 对 变量 的 某 次 使 用 只 有 
一 个 定 值 可 以 到 达 , 并 且 该 定 值 把 一 个 常量 赋 给 x, 那么 我 们 可 以 简单 地 把 x 蔡 换 为 该 常量 。 另 
一 方面 , 如 果 有 多 个 对 « 的 定 值 可 以 到 达 某 一 个 程序 点 , 我 们 就 不 能 对 * 进行 常量 折 秋 转换 。 因 
此 , 为 了 进行 常量 折叠, 我 们 希望 找到 这 样 的 定 值 : 对 于 某 个 给 定 的 程序 点 , 不管 执 行 哪 条 路 径 ， 
它们 都 是 唯一 到 达 该 点 的 对 相应 变量 的 定 值 。 对 于 图 9-12 中 的 点 (5) , 没有 哪个 定 值 是 到 达 该 点 
的 对 a 的 唯一 定 值 , 因此 对 于 点 (5) 上 的 a 来 说 , 这 个 集合 是 空 的 。 即 使 一 个 变量 在 某 个 点 上 被 
唯一 定 值 , 该 定 值 必须 把 一 个 常量 值 赋 给 该 变量 , 才 可 能 进行 常量 折 革 转换 。 这 样 ,我 们 可 以 简 
单 地 把 某 些 变量 描述 成 “非常 量 ”, 而 不 是 记录 它们 所 有 可 能 的 取 值 , 或 者 所 有 可 能 的 定 值 。 

因此 , 我 们 看 到 ,根据 分 析 的 目的 , 同样 的 信息 可 以 通过 不 同 的 方式 进行 概括 。 口 
9.2.2 ”数据 流 分 析 模式 

在 所 有 的 数据 流 分 析 应 用 中 , 我 们 都 会 把 每 个 程序 点 和 一 个 数据 流 值 (data-flow value) 关联 
起 来 。 这 个 值 是 在 该 点 可 能 观察 到 的 所 有 程序 状态 的 集合 的 抽象 表示 。 所 有 可 能 的 数据 流 值 的 
集合 称 为 这 个 数据 流 应 用 的 域 ( domain) 。 比 如 , 到 达 定 值 的 数据 流 值 的 域 是 程序 的 定 值 集合 的 










if read()<=0 gotoB, 











:b=a 
:a = 243 
goto B3 











(9) | 
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所 有 子 集 的 集合 。 某 个 数据 流 值 是 二 个 定 值 的 集合 ， 而 我 们 希望 把 程序 中 的 每 个 点 和 可 能 到 达 
该 点 的 定 值 的 精确 集合 关联 起 来 。 如 上 面 讨论 的 ， 对 于 抽象 方式 的 选择 依赖 于 分 析 的 目标 。 考 
虑 到 效率 问题 ,我 们 只 跟踪 相关 的 信息 s 
我 们 把 每 个 语句 s 之 前 和 之 后 的 数据 流 值 分 别 记 为 INLs] 和 OUT[s]。 数 据 流 问题 ( data-flow 
problem) 就 是 要 对 一 组 约束 求解 。 这 组 约束 对 所 有 的 语句 s 限 定 了 IN[s] 和 0UT[s] 之 间 的 关系 。 
约束 分 为 两 种 : 基于 语句 语义 (传递 函数 ) 的 约束 和 基于 控制 流 的 约束 。 
传递 函数 
在 一 个 语句 之 前 和 之 后 的 数据 流 值 受 该 语句 的 语义 的 约束 。 比 如 ， 假设 我 们 的 数据 流 分 析 涉及 确 
定 各 个 程序 点 上 各 变量 的 常量 值 。 如 果 变 量 a 在 执行 语句 b =a 之 前 的 值 为 。 那么 在 该 语句 之 后 a 和 
b 的 值 都 是 v。 一 个 赋值 语句 之 前 和 之 后 的 数据 流 值 的 关系 被 称 为 传递 部 数 (transfer function) o 
传递 函数 有 两 种 风格 : 信息 可 能 沿 着 执行 路 径 向 前 传播 ， 或 者 沿 着 执行 路 径 逆向 流动 。 在 一 
个 前 向 数据 流 问 题 中 , 一 个 语句 s 的 传递 函数 (通常 被 记 为 大 ) 以 语句 前 的 数据 流 值 作为 输入 , 并 
产生 语句 之 后 的 新 数据 流 值 。 也 就 是 
f OUT[s] =f,(IN[s]) 
反 过 来 , 在 一 个 逆向 流 问题 中 , 语句 EE Pa 把 一 个 语句 之 后 的 数据 流 值 转变 成 为 语句 之 
前 的 新 数据 流 值 。 也 就 是 : 
IN[s] =f,(OUT[s]) 
控制 流 约束 
第 二 组 关于 数据 流 值 的 约束 是 从 控制 流 中 得 到 的 。 基本 块 中 的 控制 流 很 简单 。 如 果 一 个 基 
ALE B hi4 s1, s2, s Sn 顺序 组 成 ,那么 s; 输出 的 控制 流 值 S 和 输入 si,1 的 控制 流 值 相同 。 
也 就 是 
TIN SOUT(s;] wi sil, oo Bd 
基本 块 之 间 的 控制 流 边 会 生成 一 个 基本 块 的 最 后 一 个 语句 和 后 继 基本 块 的 第 一 个 语句 之 间 
的 约束 ,这些 约束 更 加 复杂 。 比 如 , 如果 对 可 能 到 达 一 个 程序 点 的 所 有 定 值 感 兴趣 ， 那么 到 达 一 
个 基本 块 的 首 语句 的 定 值 的 集合 就 是 到 达 它 的 各 个 前 驱 基本 块 的 最 后 一 个 语句 之 后 的 定 值 集合 
的 并 集 。 下 一 节 将 给 出 基本 块 之 间 数据 流 的 细节 。 
9.2.3 基本 块 上 的 数据 流 模式 
从 技术 上 讲 , 数据 流 模式 涉及 程序 中 每 个 点 上 的 数据 流 值 。 但 是 如 果 我 们 认识 到 基本 块 内 
部 的 数据 流 处 理 通常 很 简单 , 就 可 以 节约 数据 流 分 析 所 需 的 时 间 和 空间 。 控制 流 从 基本 块 的 开 
始 流动 到 结尾 ,中 间 没 有 中 断 或 者 分 支 。 这 样 ， 我 们 就 可 以 用 进入 和 离开 基本 块 的 数据 流 值 的 方 
式 来 重新 描述 这 个 模式 。 对 于 每 个 基本 块 B, 我 们 把 紧 靠 其 前 和 紧 随 其 后 的 数据 流 值 分 别 记 为 
IN[ B] 和 OUTLB]。 关 于 IN[B] 和 OUT[LB] 的 约束 可 以 按照 下 面 的 方法 , 根据 关于 B 中 的 各 个 语 
句 s 的 IN[s] 和 OUT[Ls] 的 约束 得 到 。 
假设 基本 块 由 语句 s,，s。,…, 5, 顺序 组 成 。 如 果 s 是 基本 块 B 的 第 一 个 语句 , 那么 INLB] 
=IN[s]。 类 似 地 , Ms, 是 基本 块 B 的 最 后 一 个 语句 , 那么 OUT[B] = OUT[s, ]。 基 本 块 8 的 
传递 函数 记 为 fs, 它 可 以 通过 将 该 基本 块 中 各 语句 的 传递 函数 组 合 起 来 获得 该 传递 函数 。 也 就 
是 说 , US, 是 语句 s; 的 传递 函数 , 那么 fp =f eo ofa efso 该 基本 块 的 开头 和 结尾 处 的 数据 流 
值 的 关系 是 





© 原文 如 此 ;但 是 似乎 应 该 是 “数据 流 值 ”。 一 一 译 者 注 
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QUT[B] = 户 (IN[B]) 

因 基本 块 之 间 的 控制 流 而 产生 的 约束 可 以 很 容易 地 通过 重 写 得 到 , 把 原来 约束 中 的 IN[ si ] 
和 OUT(s, ] 分 别 替 换 为 INLB] 和 OUT[B] 即 可 。 比 如 , 如 果 一 个 数据 流 值 表示 的 是 可 能 被 赋予 某 
个 变量 的 常量 集合 , 那么 我 们 就 得 到 一 个 前 向 流 问题 , 其 中 

INL R] =l om xy OUTL P] 

我 们 很 快 就 会 在 处 理 活跃 变量 分 析 时 看 到 逆向 数据 流 问 题 。 逆 向 数据 流 问题 的 方程 是 类 似 

的 , 但 是 IN 和 OUT 值 的 角色 被 调换 了 。 也 就 是 说 : 
IN[B] =fs(OUT[B]) 
OUT[B] = sp ramIN[S] | 

和 线性 算术 方程 不 同 , 数据 流 方程 通常 没有 唯一 解 。 我 们 的 目标 是 寻找 一 个 最 “精确 的 ” 满 
足 这 两 组 约束 ( 即 控制 流 和 传递 的 约束 ) 的 解 。 也 就 是 说 , 我 们 需要 一 个 解 , 它 能 够 支持 有 效 的 
代码 改进 , 但 是 又 不 会 导致 不 安全 的 转换 。 这 些 不 安全 的 转换 改变 了 程序 计算 的 内 容 。 在 后 面 
数据 流 分 析 中 的 “保守 主义 ”部 分 对 这 个 问题 进行 了 简短 的 讨论 , 在 9.3.4 节 中 给 出 了 更 加 深入 
的 讨论 。 在 下 面 的 小 节 中 , 我 们 将 讨论 可 通过 数据 流 分 析 解 决 的 问题 的 某 些 最 重要 的 例子 。 
9.2.4 到 达 定 值 

“到 达 定 值 ” 是 最 常见 和 有 用 的 数据 流 模式 之 一 。 只 要 知道 当 控 制 到 达 程序 中 每 个 点 的 时 候 ， 
每 个 变量 x 可 能 在 程序 中 的 哪些 地 方 被 定 值 ,我们 就 可 以 确定 很 多 有 关 x 的 性 质 。 下 面 仅仅 给 出 
两 个 例子 : 一 个 编译 器 能 够 根据 到 达 定 值 信息 知道 * 在 点 p 上 的 值 是 否 为 常量 , TAR x TES p 
上 被 使 用 , 则 调试 器 可 以 指出 x 是 否 未 经 定 值 就 被 使 用 。 

如 果 存 在 一 条 从 紧 随 在 定 值 4 后 面 的 程序 点 到 达 某 一 个 程序 点 b 的 路 径 , 并 且 在 这 条 路 径 上 
d RAR RE”, 我 们 就 说 定 值 4 到 达 程 序 点 灰 如 果 在 这 条 路 径 上 有 对 变量 x 的 其 他 定 值 , 我 
们 就 说 变量 * 的 这 个 定 值 被 * 杀 死 "* 了 ©。 直观 地 讲 , 如 果 某 个 变量 r 的 一 个 定 值 4 到 达 点 p, 在 
A p 处 使 用 的 的 值 可 能 就 是 由 d 最 后 定 值 的 。 





wi 探测 未 定 值 先 使 用 

下 面 介绍 我 们 如 何 使 用 到 达 定 值 问题 的 解 来 探测 未 定 值 先 使 用 的 情况 。 其 窍门 是 在 流 图 
的 入 口 处 对 每 个 变量 * 引入 一 个 枉 定 值 。 如 果 * 的 哑 定 值 到 达 了 -个 可 能 使 用 * 的 程序 点 p, 
那么 % 就 可 能 在 定 值 之 前 被 使 用 。 请 注意 , 我 们 永远 不 能 绝对 肯定 这 个 程序 包含 _ 个 错误 
因为 有 可 能 存在 某 种 原因 使 得 到 达 点 而 没有 真正 对 * 赋值 的 路 径 实际 上 并 不 存在 。 这 个 原 
| 因 可 能 涉及 复杂 的 名 辑 问 是 。 








u 


变量 * 的 一 个 定 值 是 ( 可能) 将 一 个 值 赋 给 x 的 语句 。 过 程 参数 、 数 组 访问 和 间接 引用 都 可 
以 有 别名 , 因此 指出 一 个 语句 是 否 向 特定 程序 变量 x 赋值 并 不 是 件 容 易 的 事情 。 程 序 分 析 必须 是 
保守 的 。 如 果 我 们 不 知道 一 个 语句 是 否 给 x 赋 了 一 个 值 , 我 们 必须 假设 它 可 能 对 * 赋值 。 也 就 是 
说 ,在 语句 s 之 后 , 变量 * 的 值 可 能 还 是 * 执行 之 前 的 原 值 , 但 也 可 能 变 成 了 s 所 产生 的 新 值 。 为 
简单 起 见 , 在 本 章 的 其 余部 分 我 们 假设 仅仅 处 理 没有 别名 的 程序 变量 。 这 类 变量 包括 大 多 数 语 
言 中 的 局 部 标量 变量 。 在 处 理 C 或 者 C ++ 语言 时 , 有 些 局 部 变量 的 地 址 会 被 计算 出 来 , 这 种 局 
部 变量 不 属于 这 类 变量 。 











O 注意 , 路 径 中 可 能 包含 循环 , 因此 我 们 可 能 沿 着 这 条 路 径 到 达 d 的 另 一 次 出 现 。 这 种 情况 下 , d 没有 被 AE”, 
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图 9.13 中 显示 的 是 一 个 具有 了 个 定 值 的 流 图 。 让 我 们 注意 观察 所 有 到 达 基 本 块 B 的 
定 什 。 所 有 在 By 中 的 定 值 者 到 达 了 基本 块 B 的 开头 。 因 为 在 转 回 基本 块 Bo 的 循环 中 找 不 到 其 
他 的 对 j 的 定 值 , MAH B 中 的 定 值 4;: J = j -1 也 可 以 到 达 基 本 块 8 的 开头 。 但 是 , ATE 
ERATE d: j =n, 使 得 dy 不 能 到 达 Bs M Bae By 中 的 语句 da: i = i +1 MAREE Pz 
的 开头 ,这 是 因为 变量 i 总 是 被 41: i -13 重新 定 值 。 最 后 , EM de: a = v2 也 能 够 到 达 B 的 
开头 。 口 


geig Ud dih] 
kill = (dp dy dy d) 





gen py ={ dy ds } 


ic ={ d, dy, d, } 
Ben p, ={d&} 
kil ={d,} 
geng, = 1 dr) 


kill = ( dy dy) 





图 9-13 ”演示 到 达 定 值 的 流 图 


我 们 在 前 面 定义 到 达 定 值 时 , 有 时 允许 一 定 的 不 精确 性 。 但 是 它们 都 是 在 “安全 ”或 者 说 “ 保 
守 ” 的 方向 上 不 精确 。 比 如 , 请 注意 我 们 假设 一 个 流 图 的 所 有 边 都 可 以 通过 。 在 实践 中 这 个 假设 
可 能 是 不 正确 的 。 再 比如 , 在 下 面 的 程序 片断 中 , 没有 哪个 a。 和 。 的 取 值 可 以 使 得 控制 流 真 的 能 
WAJIK statement 2: 

if (a == b) statement 1; else if (a == b) statement 2; 

在 一 般 情况 下 ， 决定 一 个 流 图 的 每 条 路 径 是 否 都 可 以 被 执行 是 一 个 不 可 判定 问题 。 因 此 ， 我 
们 简单 地 假设 流 图 中 的 每 条 路 径 都 可 能 在 程序 的 某 次 执行 时 通过 。 在 大 部 分 到 达 定 值 的 应 用 中 ， 
在 一 个 定 值 不 可 能 到 达 某 点 的 情况 下 假设 其 能 够 到 达 是 保守 的 。 因此 , 我 们 可 以 允许 那些 在 程 
序 实际 执行 中 根本 不 会 被 遍历 的 路 径 , 我们 也 可 以 安全 地 人 允许 定 值 穿越 某 个 对 同一 变量 的 不 明 
确定 值 。 





数据 流 分 析 中 的 保守 主义 
实际 数据 流 值 是 通过 程序 的 所 有 可 能 执行 路 径 来 定义 的 。 所 有 的 数据 流 模式 计算 得 到 的 
都 是 对 实际 数据 流 值 的 估算 。 我 们 必须 保证 所 有 的 估算 误差 都 在 “安全 的 方向 上 。 mR 
策略 性 决定 不 允许 我 们 改变 程序 计算 出 的 内 容 , 它 就 被 认为 是 “安全 的 ”( 或 者 说 ”保守 的 ) 。 
遗憾 的 是 ,安全 的 策略 会 让 我 们 错失 一 些 能 够 保持 程序 含义 的 代码 改进 机 会 。 但 实际 上 对 所 
有 的 代码 优化 技术 而 言 , 没 有 哪个 安全 的 策略 可 以 不 错失 任何 机 会 。 使 用 不 安全 策略 就 是 以 
改变 程序 含义 的 代价 来 加 快 代码 速度 。 一 般 来 说 ,这 是 不 可 接受 的 。 
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因此 在 设计 一 个 数据 流 模式 的 时 候 , 我 们 必须 知道 这 些 信息 将 如 何 被 使 用 ,并 保证 我 们 做 
出 的 任何 舍 算 都 是 在 “保守 ”或 者 说 “安全 ”的 方向 上 。 每 个 模式 和 应 用 都 要 单独 考虑 。 比 如 ， 
如 果 我 们 把 到 达 定 值 信息 用 于 常量 折叠, 那么 把 一 个 实际 不 可 到 达 的 定 值 当 作 可 到 达 就 是 安 
全 的 (我 们 可 能 在 * 实际 是 一 个 常量 是 可 以 被 折叠 的 情况 下 认为 * 不 是 一 个 常量 ) ,但 是 把 一 
个 实际 可 到 达 的 定 值 当 作 不 可 到 达 就 是 不 安全 的 (我 们 可 能 把 * 替换 为 一 个 常量 ,但 是 实际 上 
程序 有 时 会 赋予 x 一 个 不 同 于 该 常量 的 值 ) 。 











到 达 定 值 的 传递 方程 

现在 我 们 为 到 达 定 值 问题 设置 约束 。 我 们 首先 检查 单个 语句 的 细节 。 考虑 宇 个 定 值 

d; u = vtw 
在 这 里 ，+ 号 代表 了 一 个 一 般 性 的 二 元 运算 符 。 以 后 我 们 经 常会 这 么 做 。 

这 个 语句 “生成 "了 一 个 变量 的 定 值 d, 并 * 杀 死 " 了 程序 中 其 他 对 的 定 值 ， 而 进入 这 个 语 
名 的 其 他 定 值 都 没有 受到 影响 。 因 此 , 定 值 d 的 传递 函数 可 以 被 表示 为 

fal) Seena Den killa) (9.1) 

其 中 gen, = 1d} ， 即 由 这 个 语句 生成 的 定 值 的 集合 , 而 killa 是 程序 中 所 有 其 他 对 的 定 值 。 

我 们 在 9. 22 节 讨 论 过 , 一 个 基本 块 的 传递 函数 可 以 通过 把 它 包含 的 所 有 语句 的 传递 函数 组 
合 起 来 而 构造 得 到 。 下 面 我 们 会 看 到 , 形 如 (9. 1) 的 函数 的 组 合 仍然 是 这 种 形式 。 我 们 把 这 种 形 
式 称 为 “生成 - 杀 死 形式 ”。 假设 有 两 个 函数 万 (x) = gen; U Cx — hill, ) All fo (x) = gen, U {w= 
kill) 。 那 么 

fa file) = ery U (gen; U (x kill, ) — kill, ) 
= (gen, U (gen, ~ hill, ) ) U (x ~ (hill, U kill, ) ) 

这 个 规则 可 以 扩展 到 由 任意 多 个 语句 组 成 的 基本 块 。 假 设 基本 块 B 有 个 语句 , 而 第 i 个 语 

句 的 传递 函数 为 (x) = gen; U(x -hill;), i=1, 2, +, n, 那么 基本 块 B 的 传递 函数 可 以 写成 : 
fp(x) =geng U(x -killp) 
其 中 
kill, = kill, U kill, U +++ URill, 
而 
geng =gen, U (gen, 1 — kill,) U (gen, -2 一 1-I 一 Nan)U 
-U (gen, — kill, — kill, - +++ — kill, ) 

因此 , 和 单个 语句 一 样 , 一 个 基本 块 也 会 生成 一 个 定 值 集合 并 杀 死 一 个 定 值 集合 。 集 合 gen 
中 包含 了 所 有 在 紧 靠 基本 块 之 后 的 点 上 “可 见 ” 的 该 基本 块 中 的 定 值 一 一 我 们 把 它们 称 为 “向 下 
JR” (downwards exposed) 的 。 在 一 个 基本 块 中 , 一 个 定 值 是 向 下 可 见 的 , 仅 当 它 没有 被 同一 个 
基本 块 中 较 后 的 对 同一 变量 的 定 值 * 杀 死 "。 一 个 基本 块 的 ill 集 就 是 所 有 被 块 中 各 个 语句 杀 死 
的 定 值 的 集合 。 请 注意 , 一 个 定 值 可 能 同时 出 现在 基本 块 的 gen 集 和 Kill 集中 。 在 这 种 情况 下 ， 
该 定 值 会 被 这 个 基本 块 生成 ， 即 优先 考虑 该 定 值 是 否 在 gen 集中。 这 是 因为 在 gen-kill BAP, 
kill 集会 在 gen 集 之 前 被 使 用 。 


EKR 


d: a=3 
d: a=4 


的 gen 集 是 | da| ,因为 di AKI FAT ILK ERRE kill RAT di 和 ds, 因为 di RET dz, 
dy ABET dy. BAWIE, AWA kil 集 的 运算 先 于 和 gen 集 的 并 集运 算 ， 这 个 基本 块 的 传递 函 
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数 的 结果 中 总 是 包含 定 值 do m 
控制 流 方程 
下 面 我 们 考虑 根据 基本 块 之 间 的 控制 流 得 到 的 约束 集合 。 因 为 只 有 一 个 定 值 能 够 沿 着 至 少 
一 条 路 径 到 达 某 个 程序 点 , 那么 这 个 定 值 就 到 达 该 程序 点 , 所 以 只 要 从 P 到 B 有 一 条 控制 流 边 ， 
OUT[ P] CINLB] 就 成 立 。 然 而 , 一 个 定 值 到 达 某 个 程序 点 的 必要 条 件 是 它 能 够 沿 着 某 条 路 径 到 
达 这 个 程序 点 , 因此 IN[B] 不 应 该 大 于 B 的 所 有 前 驱 基 本 块 出 口 点 的 到 达 定 值 的 并 集 。 也 就 是 
说 , 可 以 安全 地 假设 如 下 的 方程 式 成 立 : 


IN[ B] =estas OUTP] 

我 们 把 并 集运 算 称 为 到 达 定 值 的 交汇 运算 (meet operator) 。 在 任何 数据 流 模式 中 , 我 们 用 交 运算 
来 汇总 各 条 路 径 会 合 点 上 不 同 路 径 所 作 的 贡献 。 

到 达 定 值 的 迭代 算法 

我 们 假设 每 个 控制 流 图 都 有 两 个 空 基本 块 , 包括 代表 了 这 个 图 的 开始 点 的 ENTRY 结 点 以 及 
EXIT 结 点 , 所 有 离开 这 个 图 的 控制 流 都 流向 它 。 因 为 没有 定 值 到 达 这 个 图 的 开始 , 所 以 基本 块 
ENTRY 的 传递 函数 是 一 个 简单 的 返回 空 集 0 的 常 函数 , BI OUT[ ENTRY] = 9. 

到 达 定 值 问题 使 用 下 面 的 方程 定义 : 

OUT[ENTRY] = @ 
且 对 于 所 有 的 不 等 于 ENTRY 的 基本 块 B, 有 
OUT[ B] = gen, U (IN[ B] -kills) 


IN[ B] = Caen OUTLP] 
可 以 使 用 下 面 的 算法 来 求 这 个 方程 组 的 解 。 这 个 算法 的 结果 是 这 个 方程 组 的 最 小 不 动 点 (least 
fixedpoint) ， 即 对 于 各 个 IN 和 OUT, 这 个 解 给 出 的 值 总 是 此 方程 组 的 其 他 解 所 给 出 的 值 的 子 集 。 
下 面 这 个 算法 的 结果 是 可 接受 的 , 因为 在 某 个 IN 或 OUT 集中 的 定 值 确实 可 以 到 达 该 IN 或 OUT 
所 描述 的 程序 点 。 这 个 解 也 是 我 们 所 期 望 的 , 因为 它 没有 包含 任何 我 们 确定 不 会 到 达 的 定 值 。 


到 达 定 值 。 

输入 : 一 个 流 图 , 其 中 每 个 基本 块 B 的 hilly RA geng 集 都 已 经 计算 出 来 。 

输出 : 到 达 流 图 中 各 个 基本 块 8 的 入口 点 和 出 口 点 的 定 值 的 集合 , 即 IN[B] 和 OUT[B]。 

方法 : 我 们 使 用 选 代 的 方法 来 求解 。 一 开始 , 我 们 “估计 ”对 于 所 有 基本 块 都 有 OUT[B] = 
0, 并 逐步 逼近 想 要 的 IN 和 OUT 的 值 。 因 为 我 们 必须 不 停 迁 代 直 到 各 个 IN 值 (因此 各 个 OUT 值 
也 ) WOOK, 所 以 我 们 可 以 使 用 一 个 布尔 变量 change 来 记录 每 次 扫描 各 基本 块 时 是 否 有 OUT 值 发 
生 改 变 。 但 是 , 在 此 算法 及 以 后 描述 的 类 似 算法 中 , 我 们 假设 用 来 跟踪 变更 情况 的 确切 机 制 是 可 
理解 的 , 因此 我 们 删除 了 这 些 细节 。 

图 9-14 中 粗略 地 给 出 了 这 个 算法 。 前 两 行 对 某 些 数据 流 值 进行 了 初始 化 S。 从 第 (3) 行 开始 
是 一 个 循环 。 在 循环 中 我 们 不 停 地 迁 代 直到 各 个 值 收 剑 。 第 (4) 行 到 第 (6) 行 组 成 的 内 层 循环 对 
入 口 结 点 之 外 的 所 有 基本 块 应 用 数据 流 方程 。 o 

直观 地 讲 , 算法 9. 11 尽量 向 前 传播 各 个 定 值 , 直到 该 定 值 被 杀 死 , 这 样 做 模拟 了 程序 的 所 有 
可 能 的 执行 情况 。 算 法 9. 11 最 终 必 然 会 终止 ， 因 为 对 于 每 个 B,，OUT[B] 绝 对 不 会 变 小 。 一 旦 某 


O 细心 的 读者 可 能 会 注意 到 ,可 以 很 容易 把 (1) 、(2) 两 行 合并 。 但 是 , 在 类 似 的 数据 流 算法 中 , 初始 化 入 口 结 点 或 
出 口 结 点 时 用 的 方法 可 能 和 初始 化 其 他 结 点 的 方法 不 同 。 因 此 我 们 依照 所 有 的 迭代 算法 的 模式 ， 即 像 行 (1) 那样 
应 用 “边界 条 件 ” 的 动作 , 与 行 (2) 中 的 初始 化 动作 分 开 进行 。 
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个 定 值 被 加 入 到 OUT 值 中 , 它 会 一 直 待 在 那里 。( 见 练习 9.2.6。) 因 为 所 有 定 值 的 集合 是 有 限 
的 , 最 终 必 然 有 一 趟 while 循环 的 执行 没有 向 任何 OUT 加 入 任何 内 容 。 此 时 算法 就 终止 了 。 在 此 
时 终止 适 代 是 安全 的 ， 因 为 如 果 各 个 OUT 值 没有 改变 , 下 一 趟 中 各 个 IN 值 也 不 会 改变 。 而 如 果 各 
个 IN 值 没 有 改变 , OUT 值 也 不 会 改变 , 如 此 下 去 , 所 有 后 续 的 迭代 都 不 会 改变 IN 和 OUT 的 值 。 

流 图 中 的 结 点 个 数 是 while 循环 的 迭代 次 数 的 上 界 。 其 理由 是 如 果 一 个 定 值 能 够 到 达 某 个 程 
序 点 , 它 必然 可 以 通过 无 环 的 路 径 到 迷 该 点 , 而 一 个 流 图 中 的 结 点 个 数 是 无 环 路 径 中 结 点 数 的 上 
界 。 在 while 循环 的 每 次 迭代 中 , 每 个 定 值 至 少 沿 着 问题 中 的 路 径 前 进 一 个 结 点 。 而 且 , 根据 各 
个 结 点 在 内 层 循环 中 被 访问 的 顺序 , 它 经 常 一 次 前 进 多 个 结 点 。 

实际 上 , 如果 我 们 适当 地 安排 第 (4) 行 中 for 循环 访问 基本 块 的 顺序 , 经验 表明 while 循环 的 
平均 迭代 次 数 小 于 5( 见 9. 6.7 节 ) 。 因 为 定 值 的 集合 可 以 使 用 位 向 量 表示 ， 而 这 些 集合 的 运算 可 
以 使 用 位 向 量 上 的 逻辑 运算 来 实现 , 算法 9.11 在 实际 应 用 中 出 奇 地 高 效 。 
我 们 将 使 用 位 向 量 来 表示 图 9-13 中 的 七 个 定 值 d1 , dy, s d7。 其 中 左 起 第 i 个 位 表 
示 dio 集合 的 并 运算 通过 相应 的 位 向 量 的 逻辑 OR 运算 实现 。 两 个 集合 的 差 5-7 的 计算 方法 是 首 
先 计算 7 的 位 向 量 的 补 , 然后 再 将 这 个 补 和 5 的 位 向 量 进行 逻辑 AND 运算 。 

图 9-15 中 显示 的 是 算法 9. 11 中 的 IN 和 


OUT[ENTRY] = 0; 


OUT 集 的 取 值 。 其 初始 值 用 上 标 0 表示 ,如 
OUT[B]*。 它们 由 图 9-14 中 的 第 (2) 行 的 循 
HRE. 它们 都 是 空 集 , 用 比特 向 量 
000 0000 表示 。 算 法 的 后 续 欠 代 中 的 取 值 也 
使 用 上 标 表 示 ,， 第 一 趟 友 代 的 值 标记 为 
IN[B]! 和 OUT[B] ,第 二 趟 和 迭代 的 值 标记 


for (K ENTRY 之 外 的 每 个 基本 块 B) oUT[B] = 0; 
while ( 某 个 OUT 值 发 生 了 改变 ) 
for (BRENTRY 之 外 的 每 个 基本 块 互 ) { 


IN[B] = Upese tim OUTIPIs 
OUT[B] = gens U (IN[B] — kills); 
} 





图 9-14 计算 到 达 定 值 的 迭代 算法 


为 IN[B]? 和 QUT[B]?。 
假设 第 (4) 行 到 第 (6) 行 的 for 循环 在 执行 时 , B 依次 取 值 
By Bo ss Ba Bas EXIT 
当 B=B 时 ,因为 OUT[ENTRY] = 0, 所 以 IN[B1]! 是 空 集 ,而 OUT[ B1]' 等 于 geng o XNE 
和 前 面 的 值 OUT[ B, 1° RA, 因此 我 们 知道 在 第 一 轮 中 有 些 值 发 生 了 变化 (因此 会 继续 进行 第 二 
次 循环 ) 
然后 我 们 考虑 B=B,, 并 计算 
IN[ B; ]* = OUT[ B; ]! U OUT[B4]’ 
=111 000 +000 0000 = 111 0000 
OUT[ B, ]' = geng, U (IN[ B |! — killg, ) 
=000 1100 + (111 0000 = 110 0001) =001 1100 
这 个 计算 过 程 在 图 9-15 中 做 了 概括 。 比 如, 在 第 一 趟 循环 的 最 后 ，OUT[ B,]' =001 1100, 反应 
了 ds 和 4d; 在 B, 中 生成 的 事实 , 而 到 达 了 Br 的 开头 但 是 没有 在 Bs 中 被 杀 死 。 
请 注意 , 在 第 二 轮 之 后 ,， 0UT[ B, ] 的 值 有 所 改变 , 反映 了 de 也 到 达 B 的 开头 且 没 有 被 B 
杀 死 。 在 第 一 趟 中 我 们 没有 了 解 到 这 个 事实 ,因为 从 de 到 B, 结尾 的 路 径 ( 即 B, BaB) HA 
在 一 趟 中 被 顺序 经 过 。 也 就 是 说 ， 当 我 们 知道 de 到 达 B, 的 结尾 时 , 我 们 已 经 在 第 一 趟 中 计算 了 
IN[ B, ] Al OUT[ B, |. 
在 第 三 趟 之 后 , OUT 集合 中 的 所 有 值 都 没有 改变 。 因 此 , 算法 在 第 三 趟 之 后 终止 。 此 时 , 各 
A IN Ail OUT 的 值 如 图 9-15 中 最 后 两 列 所 示 。 口 
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oUT[B] | IN[B] | our[B 
111 0000 | 000 0000 | 111 0000 
001 1100 | 111 0111 | 001 1110 
000 1110 | 001 1110 | 000 1110 
001 0111 | 001 1110 | 001 0111 
001 0111 | 001 0111 | 001 0111 


| Block B | our[B] | m{B]' 
Bi 000 0000 | 000 0000 
Bo 000 0000 | 111 0000 
Bs 000 0000 | 001 1100 
B4 000 0000 | 001 1110 
EXIT 000 0000 | 001 0111 


图 9-15 IN 和 OUT 的 计算 过 程 












9.2.5 活跃 变量 分 析 

有 些 代码 改进 转换 所 依赖 的 信息 是 按照 程序 控制 流 的 相反 方向 进行 计算 的 , 我 们 现在 将 要 
研究 这 样 的 一 个 例子 。 在 活跃 变量 分 析 ( live-variable analysis) H, 我 们 希望 知道 对 于 变量 x 和 程 
序 点 p, «在 点 p 上 的 值 是 否 会 在 流 图 中 的 某 条 从 点 p 出 发 的 路 径 中 使 用 。 如 果 是 , 我 们 就 说 + 在 
p 上 活跃 ; 否则 就 说 x Ep 上 是 死 的 。 

活路 变量 信息 的 重要 用 途 之 一 是 为 基本 抉 进行 寄存 器 分 配 。 在 8.6 节 和 8.8 节 中 已 经 介绍 
了 这 个 问题 的 某 些 方面 。 在 一 个 值 被 计算 并 保存 到 一 个 寄存 器 中 后 , 它 很 可 能 会 在 基本 块 中 使 
用 。 如 果 它 在 基本 块 的 结尾 处 是 死 的 ， 就 不 必 在 结尾 处 保存 这 个 值 。 另 外 , 在 所 有 寄存 器 都 被 占 
用 时 , 如果 我 们 还 需要 申请 一 个 寄存 器 的 话 , 那么 应 该 考虑 使 用 一 个 存放 了 已 死亡 的 值 的 寄存 
器 ,因为 这 个 值 不 需要 保存 到 内 存 。 

这 里 我 们 直接 以 IN[B] 和 0UT[B] 的 方式 定义 数据 流 方程 。IN[B] 和 0UT[ B] 分 别 表示 在 紧 千 
基本 块 B 之 前 和 紧 随 8B 之 后 的 点 上 的 活跃 变量 集合 。 这 些 方程 可 以 通过 以 下 的 方法 得 到 : 首先 定义 
各 个 语句 的 传递 函数 ,然后 再 把 它们 组 合 起 来 得 到 一 个 基本 块 的 传递 函数 。 我 们 给 出 下 面 的 定义 : 

1) defs 是 指 如 下 变量 的 集合 , 这 些 变量 在 B 中 的 定 值 ( 即 被 明确 地 赋值 ) 先 于 任何 对 它们 的 
使 用 。 

2) usep 是 指 如 下 变量 的 集合 , 它们 的 值 可 能 在 B 中 先 于 任何 对 它们 的 定 值 被 使 用 。 
OEE tio, 图 9-13 中 的 基本 块 B, 一 定 使 用 了 i。 除非 i 和 j 互 为 对 方 的 别名 ,否则 会 在 对 j 
的 任何 重新 定 值 之 前 使 用 j。 假 设 图 9-13 中 的 变量 之 间 没有 别名 关系 , 那么 usep, = li, jlo BI, 
B, 显然 对 i 和 j 定 值 。 假 设 没有 别名 问题 , 因为 有 在 定 值 之 前 使 用 了 i 和 j, 所 以 defs, = 11。 O 

根据 这 些 定义 , uses 中 的 任何 变量 都 必然 被 认为 在 基本 块 B 的 入口 处 活跃, 而 defy 中 的 变 
BITE B 的 开头 一 定 是 死 的 。 实 际 上 , defy 中 的 成 员 “ 杀 死 "* 了 某 个 变量 可 能 因 从 B 开始 的 某 条 路 
径 而 成 为 活跃 变量 的 任何 机 会 。 

这 样 , 把 def 和 use 与 未 知 的 IN 和 OUT 值 联系 起 来 的 方程 定义 如 下 ; 

IN[ EXIT] = @ 
且 对 于 所 有 的 不 等 于 EXIT 的 基本 块 B 来 说 : 
IN[ B] =useg U (OUT[B] = def, ) 
GUTIBT =U. ny NS 

第 一 个 方程 描述 了 边界 条 件 , 即 在 程序 的 出 口 处 没有 变量 是 活跃 的 。 第 二 个 方程 说 明 一 个 
变量 要 在 进入 一 个 基本 块 时 活跃 , 必须 满足 下 面 两 个 条 件 中 的 一 个 : 要 么 它 在 基本 块 中 被 重新 定 
值 之 前 就 被 使 用 ; 要 么 它 在 离开 基本 抉 时 活跃 且 在 基本 块 中 没有 对 它 重新 定 值 。 第 三 个 方程 说 
一 个 变量 在 离开 一 个 基本 块 时 活跃 当 且 仅 当 它 在 进入 该 基本 块 的 菜 个 后 继 时 活路 。 

应 该 注意 一 下 活路 性 方程 和 到 达 定 值 方程 之 间 的 关系 : 

。 两 组 方程 都 以 并 集运 算 作为 交汇 运算 。 其 原因 是 在 各 个 数据 流 模式 中 , 我 们 都 沿 着 路 径 

传播 信息 ,并 且 我 们 只 关心 是 否 存在 任何 路 径 具 有 我 们 想 要 的 性 质 , 而 不 是 关心 某 些 结 
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论 是 否 在 所 有 的 路 径 上 都 成 立 。 
。 但 是 , 活跃 性 的 信息 流 逆向 遍历 , 这 和 控制 流 的 方向 相反 。 其 中 的 原因 是 在 这 个 问题 中 ， 
我 们 试图 保证 在 一 个 程序 点 上 对 变量 % 的 使 用 可 以 被 传递 到 在 某 个 执行 路 径 中 五 之 前 
的 所 有 程序 点 , 这样 我 们 才 知 道 在 前 面 的 这 些 点 上 x 的 值 会 被 使 用 。 
为 了 解决 一 个 逆向 传播 的 数据 流 问 题 , 我 们 对 IN[ EXIT] (而 不 是 OUT[ ENTRY J ) 进行 初始 
化 。IN 和 OUT 集合 的 角色 相互 对 调 了 , use 和 def 分别 替代 了 gen 和 有 1。 和 到 达 定 值 问题 一 样 ， 
活跃 性 方程 的 解 不 必 是 唯一 的 , 且 我 们 希望 得 到 具有 最 小 活跃 变量 集合 的 解 。 解 方程 时 使 用 的 算 
法 本 质 上 是 算法 9. 11 的 道 向 传播 版 本 。 


IN[EXIT] = 0; 





活跃 变量 分 析 。 fo (rz te ESRB) NIE) = P: 
wnile IN 
输入 : 一 个 流 图 , 其 中 每 个 基本 块 的 use 和 def for ( 除 EXIT 之 外 的 每 个 基本 块 B) { 
已 经 计算 出 来 。 OUT[B] = Uses ram MIS]; 
IN[B] = useg U (OUT[B] — defp); 
输出 : 该 流 图 的 各 个 基本 块 B 的 人口 和 出 口 } iy i 
处 的 活跃 变量 集合 即 IN[B] 和 OUT[B]。 


方法 : 执行 图 9-16 中 的 程序 。 回 图 9-16 计算 活路 变量 的 迭代 算法 


9. 2.6 可 用 表达 式 

如 果 从 流 图 入 口 结 点 到 达 程 序 点 p 的 每 条 路 径 都 对 表达 式 x +y 求 值 , 且 从 最 后 一 个 这 样 的 
求 值 之 后 到 p 点 的 路 径 上 没有 再 次 对 x y 赋值 9 , BRA x+y 在 点 p 上 可 用 (available)。 对 于 可 
用 表达 式 数据 流 模式 而 言 , 如 果 一 个 基本 块 对 % 或 7 赋值 (或 可 能 对 它们 赋值 ), 并 且 之 后 没有 再 
重新 计算 x+y, 我 们 就 说 该 基本 块 “ 杀 死 *5 了 表达 式 x+y。 如 果 一 个 基本 块 一 定 对 x+y 求 值 , 并 
AZ WAM xR y EA, 那么 这 个 基本 块 生成 表达 式 %+y。 

请 注意 ,“ 杀 死 "或 “生成 ”一 个 可 用 表达 式 的 概念 和 达到 定 值 中 的 概念 并 不 完全 相同 。 尽 管 
如 此 , 这 些 “ 杀 死 ” 或 “生成 ”的 概念 在 行为 上 和 到 达 定 值 中 的 相 
应 概念 在 本 质 上 是 一 致 的 。 

可 用 表达 式 信息 的 主要 用 途 是 寻找 全 局 公共 子 表达 式 。 比 
如 , 在 图 9-17a F, 如 果 4 x i EAR B, 的 入 口 点 可 用 , 那么 基 
本 块 B; 中 的 表达 式 4*i 就 是 一 个 公共 子 表达 式 。 它 在 该 处 可 用 
的 条 件 是 i 在 基本 块 B, 中 没有 被 赋予 一 个 新 值 , 或 者 像 图 9-17b 
所 示 的 那样 在 B, 中 对 i 赋值 后 又 重新 计算 了 4 * io 

我 们 可 以 从 头 到 尾 地 处 理 基 本 块 内 的 各 个 语句 , 计算 一 个 基 
本 块 内 各 个 点 上 生成 的 表达 式 的 集合 。 在 基本 块 前 面 的 点 上 没有 
任何 生成 的 表达 式 。 如 果 在 点 pb 处 可 用 表达 式 的 集合 是 5, 而 4 
是 p 之 后 的 点 , 且 它 们 之 间 是 语句 x =y +z, 那么 通过 下 面 的 两 
个 步骤 可 得 到 点 gq 上 的 可 用 表达 式 集合 。 

1) 把 表达 式 y+z 添加 到 5 中 。- : 

2) M S 中 删除 任何 涉及 变量 x 的 表达 式 。 图 9-17 跨越 多 个 基本 块 的 

请 注意 , 因为 x 可 能 和 yy 或 z 相 同 , 所 以 上 面 的 步 又 必须 按照 潜在 的 公共 子 表达 式 
正确 的 顺序 执行 。 在 我 们 到 达 基 本 块 的 结尾 处 时 ,5 就 是 该 基本 








O 请 注意 , 如 在 本 章 中 通常 使 用 的 , 我 们 使 用 运算 符 + 来 代表 一 个 一 般 性 的 运算 符 , 不 是 一 定 指 加 法 运算 。 
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块 生成 的 表达 式 集合 。 而 被 杀 死 的 表达 式 的 集合 就 是 所 有 类 似 于 y+z 的 表达 式 , 其 中 7 或 = 在 基 
本 块 中 被 定 值 , 并 且 这 个 基本 块 没有 生成 y+z。 

DEA 280-18 中 的 四 个 语句 。 在 第 一 个 语句 之 后 5+e 可 用 。 在 第 二 个 语句 之 后 a。-d 
变 得 可 用 , 但 是 因为 被 重新 定 值 , ! + e 变 得 不 再 可 用 。 第 三 

个 语句 并 没有 使 5+c 可 用 , 因为 e 的 值 立 刻 就 被 改变 了 。 在 最 0 
后 一 个 语句 之 后 , 因为 d 的 值 已 经 改变 , a-d 不 再 可 用 。 因 此 
这 个 基本 块 没有 生成 任何 可 用 表达 式 , 所 有 涉及 a、b、c、d 的 
表达 式 都 被 杀 死 了 。 口 

我 们 可 以 用 类 似 于 计算 到 达 定 值 的 方法 来 寻找 可 用 表达 
式 。 假 设 U 是 所 有 出 现在 程序 中 一 个 或 多 个 语句 的 右 部 的 表达 
式 的 全 集 。 对 于 每 个 基本 块 B， 令 IN[B] 表 示 在 B 的 开始 处 可 。 图 9.18 可 用 表达 式 的 计算 
用 的 U 中 的 表达 式 的 集合 。 令 OUT[ BI ERE B 的 结尾 处 可 用 
的 表达 式 集合 。 定 义 。_gens 为 B 生成 的 表达 式 的 集合 ,而 ekila 为 被 8 杀 死 的 口中 的 表达 式 的 
集合 。 请 注意 , IN, OUT. egen F ekil 都 可 以 使 用 位 向 量 表示 。 下 面 的 方程 给 出 了 未 知 的 IN 和 
OUT 值 之 间 , 以 及 它们 和 已 知 量 egen 与 e_kill 之 间 的 关系 : 

OUT[ ENTRY] = @ 
并 且 对 于 除 ENTRY 之 外 的 所 有 基本 块 B, 有 
OUT[B] =e_geng U(IN[ B] -e_killp) 
INEB] = 人 pw ogy rv OUTLP] 

上 面 的 方程 和 到 达 定 值 方程 组 看 起 来 几乎 一 样 。 和 到 达 定 值 类 似 , 这 个 方程 组 的 边界 条 件 
也 是 OUTLENTRY] = 0, 这 是 因为 在 ENTRY 的 出 口 处 没有 任何 可 用 表达 式 。 其 中 最 重要 的 不 同 
之 处 在 于 这 个 方程 组 的 交汇 运算 是 交集 运算 , 而 不 是 并 集运 算 。 因为 只 有 当 一 个 表达 式 在 一 个 
基本 块 的 所 有 前 驱 的 结尾 处 都 可 用 , 它 才 会 在 该 基本 块 的 开头 可 用 , 因此 使 用 交集 运算 是 正确 
的 。 相反, 只 要 一 个 定 值 到 达 了 一 个 基本 块 的 任何 一 个 前 驱 的 结尾 处 , 它 就 到 达 了 该 基本 块 的 开 
头 , 所 以 在 到 达 定 值 方程 组 中 使 用 并 集运 算 作为 交汇 运算 。 

使 用 而 不 是 U 使 得 可 用 表达 式 方程 组 的 表现 和 到 达 定 值 方程 组 的 表现 不 同 。 虽 然 两 组 方 
程 都 没有 唯一 解 , 但 到 达 定 值 方程 组 的 解 是 符合 “到 达 ” 的 定义 的 最 小 集合 。 在 求解 到 达 定 值 方 
程 的 过 程 中 , 我 们 首先 假设 任何 地 方 都 没有 定 值 到 达 , 然后 逐渐 增 大 到 达 定 值 的 集合 , 最 终 构建 
得 到 该 解 。 在 这 个 方法 里 , 除非 找到 一 条 能 把 某 个 定 值 4 传播 到 某 个 点 p 的 实际 路 径 , 否则 我 们 
从 来 不 假设 d 能够 到 达 p。 相 反 , 对 于 可 用 表达 式 方程 组 , 我 们 希望 得 到 具有 最 大 可 用 表达 式 集 
合 的 解 。 因 此 , 我 们 首先 给 出 较 大 的 近似 值 , 然后 逐步 消减 。 

首先 , 我 们 假设 “在 除了 入 口 基本 块 结尾 处 之 外 的 所 有 地 方 , 所 有 表达 式 ( 即 集合 0) 都 是 可 用 
的 ”。 只 有 当 我 们 发 现 有 一 条 路 径 使 得 某 个 表达 式 不 可 用 时 , 我 们 才 删 除 这 个 表达 式 。 这 种 方法 看 
起 来 不 是 那么 显而易见 , 但 是 我 们 可 以 得 到 一 个 真正 的 可 用 表达 式 的 集合 。 在 处 理 可 用 表达 式 时 ， 
生成 一 个 可 用 表达 式 的 精确 集合 的 子 集 是 保守 的 。 之 所 以 说 使 用 子 集 是 保守 的 , 是 因为 我 们 将 把 这 
个 信息 用 于 把 一 个 可 用 表达 式 的 计算 替换 为 之 前 计算 得 到 的 值 。 不 知道 一 个 表达 式 是 可 用 的 只 会 
使 我 们 失去 改进 代码 的 机 会 , 而 把 一 个 不 可 用 的 表达 式 认为 可 用 则 会 使 我 们 改变 程序 的 计算 结果 。 
DEG 我 们 将 把 注意 力 集中 在 图 9-19 中 的 基本 块 B。 上 , 说 明 OUT[ B, ] 的 初始 近似 值 对 
IN[ By ] 的 影响 。 令 G 和 分别 为 e_gengp, 和 e_killp, 的 缩写 。B, 的 数据 流 方程 为 

IN[ B, ] = OUT[ B; ] NOUT[B, ] 
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OUT[ B, ] =GU(IN[B,] -K) 

$1 Fn OÙ HIER INL BA JAN 0UTL 8] 的 第 j 次 循环 计算 得 到 的 近似 值 ， © 
这 些 方程 式 可 以 被 写成 下 列 的 迁 代 计算 式 ， 

F+! = OUT, B, 1 NO 

Ol th C10 (WR) 
从 O° = 0 开始 , 我 们 得 到 7! = OUT[B,] moo = p, 但 是 , 如 果 我 们 从 0 
=U Fit, 那么 我 们 得 到 卫 =0UT[ Bi] N09=0UT[ Bi], 而 这 才 是 我 们 图 9-19 将 OUT 集 合 
应 该 得 到 的 值 。 直 观 地 讲 ， 以 O° = 作为 初始 值得 到 的 解 更 符合 我 们 的 初 谷 化 为 9 局 限 性 太 大 


期 望 ， 因 为 这 个 解 正确 地 反映 了 下 面 的 事实 ， 如 果 'OUT[ Bi 门 中 的 某 个 表 
达 式 没有 被 B, 杀 死 , 那么 它 在 B, 的 结尾 处 可 用 ， Oo 


可 用 表达 式 。 

输入 : 一 个 流 图 , 对 其 中 的 每 个 基本 块 B， e_hilly 和 e_gens 的 值 已 经 计算 得 到 。 流 图 的 初始 
基本 块 是 Bio OUT[ENTRY] = 9; 

输出 : 在 流 图 的 各 个 基本 块 的 人 口 处 for ( 除 ENTRY 之 外 的 每 个 基本 块 B) ouT[B] = U; 
eee? ae ale 





OUT[ B]. IN[B] =N pg pi OUTIP]; 

Hr: 执行 图 9.20 中 的 算 E. 图 9-20 ) ouT[B] = e-geng U (IN[B] — e_killg); 
中 各 个 步 又 的 解释 类 似 于 图 9-14 的 算法 中 
的 解释 。 E 图 9-20 计算 可 用 表达 式 的 迭代 算法 
9.2.7 小 结 


在 本 节 中 , 我 们 讨论 了 数据 流 问题 的 三 个 实例 ， 到 达 定 值 、 活路 变量 和 可 用 表达 式 。 如 
图 9-21 中 所 总 结 的 ， 每 个 问题 的 定义 都 是 通过 数据 流 值 的 域 、 数据 流 的 方向 、 传 递 函 数 族 、 边 界 
条 件 和 交汇 运算 来 定义 的 。 我 们 一 般 用 人 表示 交汇 运算 。 

图 9-21 的 最 后 一 列 显示 了 和 迭代 算法 中 使 用 的 初始 值 。 我 们 选择 这 些 值 的 目的 是 使 得 迭代 算 
法 可 以 找到 方程 组 的 最 精确 解 。 严 格 地 讲 ， 这 个 选择 并 不 是 数据 流 问题 的 定义 的 一 部 分 , 因为 它 
是 为 满足 迭代 算法 的 需要 而 人 工 给 出 的 产品 。 还 有 其 他 途径 可 以 解决 数据 流 问题 。 比 如 , 我 们 
己 经 看 到 了 如 何 把 一 个 基本 块 中 各 个 语句 的 传递 函数 组 合 起 来 得 到 该 基本 块 的 传递 函数 我 们 


活跃 变量 可 用 表达 式 
变量 的 集合 表达 式 的 集合 
ga Mh 
~ 2 
函数 


TICITEOSIEIEISINICIITTEON 
E70) CNS OE ee eae 


方程 组 OUT[B] = fs(IN[B]) | IN[B] = fs(OUT[B]) OUT[B] = fz (IN[B]) 
IN[B] = OUT[B] = IN[B] = 
Ap preatpy OUTIP] Ms ,sueeta) INIS] MPipreatB) OUT[P] 


OUT[B] = 0 






















图 9-21 三 个 数据 流 问 题 的 总 结 
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9.2.8 9.2 节 的 练习 

练习 9. 2. 1: 对 图 9-10 中 的 流 图 ( 见 9.1 节 的 练习 ), 计算 下 列 值 : 

1) 每 个 基本 块 的 gen 和 kill 集合 。 

2) 每 个 基本 块 的 IN 和 OUT 集合 。 

练习 9. 2.2: 对 图 9-10 的 流 图 , 计算 可 用 表达 式 问 题 中 的 egen、e_kill、IN 和 OUT 集合。 

练习 9. 2. 3: 对 图 9:10 MRA, 计算 活跃 变量 分 析 中 的 def, use, IN 和 OUT 集合 。 

| 练习 9. 2.49: 假设 V 是 复数 的 集合 。 下 面 的 哪个 运算 可 以 被 用 作 V 上 的 一 个 半 格 结构 的 
交汇 运算 ? 

1) 加 法 : (a+i6)A(e+tid)=(a+c) +i(b+d) 

2) 乘法 : (a+ib) \ (c+id) = (ac -bd) +i(ad+bc) 

3) 按 分 量 求 最 小 : (a+ib) (c+id) =min(a, c) +i min(b, d) 

4) 按 分 量 求 最 大 : (a+ib) 人 (c+id) =max(a, c) +i max(b, d) 

! 练习 9. 2.5: 我 们 曾经 说 过 , 如 果 一 个 基本 块 B 由 个 语句 组 成 , 并 且 第 i 个 语句 的 gen 集 
BA Kill 集合 分 别 是 gen; 和 kill;, 那么 基本 块 B 的 传递 函数 的 gen 集合 geng 和 所 UL 集合 killp 可 以 ; 
由 下 面 的 公式 给 出 : 

kill, = kill, U kill, UU 
geng = gen, U (gen, -1 — kill, ) U( gen, 2 — kill, 1 -—hill,) U 
"U (gen, — kill, = kill, — +--+ — kill, ) 
请 通过 对 n 的 归纳 来 证 明 这 个 说 法 。 

| 练习 9. 2.6: 请 通过 对 算法 9. 11 中 第 (4) 到 第 (6) 行 的 for 循环 的 迭代 次 数 的 归纳 , 证 明 
IN 和 OUT 的 值 都 不 会 缩小 。 也 就 是 说 , 一 但 某 个 定 值 在 某 次 循环 的 时 候 被 放 到 其 中 的 一 个 集合 
H, 它 决 不 会 在 以 后 的 某 次 循环 中 消失 。 

| 练习 9.2.7; 证 明 算 法 9.11 的 正确 性 , 也 就 是 证 明 : 

1) 如 果 定 值 d 被 放 到 IN[ Bj] 或 OUT[B] 中 , 那么 相应 地 必然 有 一 条 从 d 到 基本 块 B 的 开始 
处 或 结尾 处 的 路 径 。 在 这 条 路 径 中 , 由 d 定 值 的 变量 不 会 被 重新 定 值 。 

2) WREE d 最 后 没有 被 放 到 IN[B 或 OUT[B] 中 , 那么 相应 地 必然 没有 从 d 到 基本 块 B 
的 开始 处 或 结尾 处 的 路 径 。 在 这 条 路 径 中 , 由 d 定 值 的 变量 不 会 被 重新 定 值 。 

! 练习 9. 2.8: 证 明 有 关 算法 9. 14 的 下 列 性 质 : 

1) 各 个 IN 和 OUT 的 值 不 会 缩小 。 

2) 如 果 变 量 * 被 放 到 IN[B] 或 OUT[B] 中 , 那么 相应 地 有 一 条 从 基本 块 B 的 开始 处 或 结尾 
处 出 发 的 路 径 , 在 这 条 路 径 上 x 可 能 被 使 用 。 

3) WREE x 没有 被 放 到 IN[B] 或 OUT[B] 中 , 那么 相应 地 没有 从 基本 块 B 的 开始 处 或 结 
尾 处 出 发 的 路 径 , 使 得 x 在 这 条 路 径 上 被 使 用 。 








为 什么 可 用 表达 式 算法 是 正确 的 
我 们 需要 解释 一 下 为 什么 下 面 的 结论 成 立 ， 即 在 一 开始 的 时 候 把 大 口 基本 块 之 外 的 其 他 
所 有 基本 块 的 0UT 值 都 设置 为 U( 即 所 有 表达 式 的 集合 ) ,最终 仍 可 以 得 到 这 些 数据 流 方程 的 
保守 解 。 也 就 是 说 ,找到 的 可 用 表达 式 确实 都 是 可 用 的 。 第 一 ,因为 在 这 个 数据 流 模式 中 的 








O 本 练习 在 9. 3 节 之 后 完成 。 
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交汇 运算 是 交集 运算 , 任何 发 现 x+y 在 某 个 程序 点 上 不 可 用 的 理由 都 会 在 流 图 中 沿 着 所 有 可 
能 的 路 径 向 前 传播 , 直到 * +y 被 重新 计算 并 再 次 变 得 可 用 为 止 。 第 二 , 只 有 两 个 理由 可 能 会 
fE x +y 变 成 不 可 用 的 。 

1) 因为 x 或 y 在 基本 块 B 中 被 定 值 且 其 后 没有 计算 x*+y, 因此 x+y 被 杀 死 。 在 这 种 情 
况 下 , 我 们 第 一 次 应 用 传递 函数 fs 的 时 候 , x +y 就 会 从 OUT[B] 中 被 删除 。 

2) 在 某 些 路 径 中 , x +y 一 直 没有 被 计算 。 因 为 x +y 肯定 不 会 在 OUT[ ENTRY] 中 , 并 且 
它 也 不 会 在 上 面 说 的 那 条 路 径 中 被 生成 。 我 们 可 以 通过 对 路 径 长 度 的 归纳 来 证 明 x +y 最 终 
会 从 这 条 路 径 的 所 有 基本 块 的 IN 和 OUT 值 中 删除 。 

因此 , 当 各 个 IN 和 OUT 值 不 再 改变 的 时 候 , 图 9-20 中 提 到 的 迭代 算法 给 出 的 解 将 只 包 
含 真正 的 可 用 表达 式 。 














| 练习 9.2.9: 证 明 有 关 算法 9. 17 的 下 列 特性 : 

1) & IN fl OUT 的 值 决 不 会 增长 。 也 就 是 说 , 这 些 集合 在 后 来 的 取 值 总 是 它们 前 面 取 值 
的 子 集 (不 一 定 是 真子 集 )。 

2) 如 果 表 达 式 e 从 IN[B] 或 OUT[LB] 中 被 删除 , 那么 必然 相应 地 存在 一 条 从 流 图 入 口 到 达 B 
的 开始 处 或 结尾 处 的 路 径 , 要 么 。 在 这 条 路 径 上 从 没有 被 计算 过 , 要 么 在 最 后 一 次 对 e 计算 之 后 ， 
e 的 某 个 参数 被 重新 定 值 了 。 

3) 如 果 表 达 式 最 终 保留 在 IN[B] 或 0UTLB] 中 , 那么 相应 地 从 流 图 入口 到 基本 块 B 开始 处 
或 结尾 处 的 所 有 路 径 中 ,e 都 被 计算 , 且 在 最 后 一 次 计算 e 之 后 , e 的 参数 都 没有 被 重新 定 值 。 

! 练习 9. 2.10; 细心 的 读者 可 能 注意 到 在 算法 9. 11 中 , 我 们 可 以 把 各 个 基本 块 B 的 gen, 初始 
化 为 OUTLB], 这 样 可 以 减少 一 些 运 行 时 间 。 类 似 地 , 我 们 还 可 以 在 算法 9. 14 中 把 uses 初始 化 为 
IN[B] . 我们 没有 这 么 做 的 原因 是 为 了 用 统一 的 方法 来 处 理 这 个 主题 。 我 们 将 在 算法 9.25 中 再 次 
看 到 这 一 点 。 但 是 , 可 以 在 算法 9.17 中 把 e_gens 初始 化 为 0UT[B] 吗 ? 为 什么 可 以 或 不 可 以 ? 

! 练习 9.2. 11: BODIE, 我 们 的 数据 流 分 析 没 有 利用 条 件 跳 转 的 语义 。 假 设 我 们 在 一 个 
基本 块 的 结尾 处 找到 一 个 如 下 的 测试 : 


it G SLO) oto val. 
我 们 如 何 利 用 对 测试 表达 式 * <10 的 理解 来 改进 有 关 到 达 定 值 的 知识 ?请 记 住 , 在 这 里 “改进 ” 
意味 着 我 们 要 消除 某 些 实际 上 永远 不 可 能 达到 某 个 程序 点 的 到 达 定 值 。 


9.3 数据 流 分 析 基 础 


我 们 已 经 给 出 了 几 个 数据 流 抽象 的 有 用 的 例子 ,现在 我 们 以 整体 的 方式 抽象 地 研究 数据 流 
模式 族 。 我 们 将 正式 回答 下 列 有 关 数 据 流 算法 的 基本 问题 : 

1) 数据 流 分 析 中 用 到 的 迭代 算法 在 什么 情况 下 是 正确 的 ? 

2) 通过 和 迭代 算法 得 到 的 解 有 多 精确 ? 

3) 和 迭代 算法 收敛 吗 ? 

4) 这 些 方程 组 的 解 的 含义 是 什么 ? 

在 9.2 节 中 我 们 描述 到 达 定 值 问题 的 时 候 已 经 非 正式 地 回答 了 上 面 的 问题 。 对 于 后 来 的 几 
个 数据 流 问 题 ,我 们 并 没有 从 头 回答 同样 的 提问 , 我们 依靠 新 间 题 和 已 讨论 的 问题 之 间 的 相似 之 
处 来 解释 新 问题 。 本 节 中 我 们 试图 做 到 一 劳 永 逸 。 针 对 一 大 类 的 数据 流 问题 , 我 们 给 出 一 个 一 
般 性 的 方法 来 严格 地 回答 这 些 问题 。 我 们 首先 确定 数据 流 模式 的 预期 特性 , 并 证 明 这 些 特 性 所 
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蕴含 的 信息 , 包括 正确 性 、 精 确 性 、 数 据 流 算法 的 收敛 性 ,以 及 方程 组 解 的 含义 。 这 样 , 在 理解 
老 算法 或 者 写 新 算法 的 时 候 , 我 们 只 需要 给 出 相应 的 数据 流 问 题 定义 所 具有 的 特性 , 就 可 以 立刻 
得 到 对 上 面 各 个 问题 的 回答 。 
对 一 类 模式 给 出 一 个 统一 的 理论 框架 也 有 实践 意义 。 这 个 框架 有 助 于 我 们 在 软件 设计 中 确 
定 求解 算法 的 可 复 用 组 件 。 因 为 不 需要 对 类 似 的 细节 进行 多 次 重复 编码 , 所 以 不 仅 编 码 的 工作 
量 降低 了 , 编程 错误 也 会 减少 。 
一 个 数据 流 分 析 框 架 (D, V, A, 下) 由 下 列 元 素 组 成 
1) 一 个 数据 流 方向 D, 它 的 取 值 包括 FORWARD ( filial) # BACKWARD (GX f ) 。 
2) 一 个 半 格 (定义 请 见 9.3. 1 节 )，, 它 包括 值 集 V 和 一 个 交汇 运算 人 。 
3) 一 个 从 了 到 了 的 传递 函数 族 R。 这 个 传递 函数 族 中 必须 包括 可 用 于 刻 划 边界 条 件 的 函数 ， 
即 作用 于 任何 数据 流 图 中 的 特殊 结 点 ENTRY 和 EXIT 的 常 值 传递 函数 。 
9.3.1 Re 
Æ ( semilattice) 是 满足 下 列 条 件 的 一 个 集合 和 一 个 三 元 交汇 运算 和 人。 对 于 了 中 的 所 有 x 
X. All z: . 
1) «Ax=<(20LiZRRFRH). 
2) x 人 y=yAx( 交 汇 运 算是 可 交换 的 )。 
3) x 八 (yAz) = (xAy) Az( 交 汇 运 算是 符合 结合 律 的 )。 
半 格 有 一 个 顶 元 素 , 表示 为 T, 使 得 对 于 V 中 的 所 有 x, TAX =% 
半 格 可 能 还 有 一 个 底 元 素 , 表示 为 |, 使 得 对 于 V 中 的 所 有 x, LAx= 1。 
偏 序 
正如 我 们 将 看 到 的 , 一 个 半 格 的 交汇 运算 定义 了 值 域 上 的 一 个 偏 序 。 假 设 < 为 V 上 的 一 个 
关系 ,如 果 对 于 VY 上 的 所 有 x, y 和 z 都 有 : 
1) x 志 x( 该 偏 序 是 自 反 的 )。 
2) MAR «sy H ysr, 那么 x=y( 该 偏 序 是 反对 称 的 )。 
3) 如 果 %<y 且 y<z, 那么 x<z( 该 偏 序 是 传递 的 ) 
那么 和 就 是 一 个 偏 序 (partial order) o 
二 元 组 (Y，< ) 被 称 为 偏 序 集 ( partially ordered set, poset) 。 对 于 一 个 偏 序 集 , 定义 如 下 的 关 
系 < 会 带 来 一 些 方 便 : 
%<y 当 且 仅 当 (x<y) H ax¥y 
半 格 的 偏 序 
为 半 格 (V， 人 ) 定 义 一 个 如 下 的 偏 序 < 会 有 所 帮助 。 对 于 V 中 的 所 有 和, 我 们 定义 
ssy 当 有 目 仅 当 x 人 y=% 
因为 交汇 运算 人 是 等 寡 的 、 可 交换 的 且 满足 结合 律 ， 上 面 定义 的 序 和 就 是 自 反 的 、 反 对称 的 和 传 
递 的 。 下 面 来 说 明 其 中 的 原因 : 
© ARE: 即 对 于 所 有 的 x, x 和 x。 因 为 交汇 运算 是 等 寡 的 ,因此 元 N =x, 
© 反对 称 性 : 即 如 果 *<y 且 ys 和 x, 那么 x=y。 在 证 明 中 , ssy 意味 着 x 人 y=x, 而 y<x 意 
味 着 YAxz =ye 根据 人 的 可 交换 性 , x = (x Ny) =(yAx) =y。 
© 传递 性 : 即 如 果 x<y 且 y<z, 那么 x<z。 证 明 如 下 ; x<y 自 yz BURG xAy=x% HyAz=y, 
那么 使 用 交汇 运算 的 结合 律 得 到 (*Az) = ((x Ay) Nz) = (aN (yAz)) = (aNy) =x. 
因为 已 经 证 明了 xAz=x, 我 们 有 x<z, 从 而 证 明了 传递 性 。 
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在 9.2 节 的 例子 中 使 用 的 交汇 运算 是 集合 的 并 集 或 交集 运算 。 它 们 都 是 等 基 的 , 可 交 
换 的 和 可 结合 的 。 对 于 集合 的 并 运算 , 顶 元 素 是 0, 而 底 元 素 是 全 集 U, 这 是 因为 对 于 U 的 任何 
FRx MAO Ux=% 且 UU x= U, 对 于 集合 的 交汇 运算 , TUMLE 0o 半 格 的 值 域 了 了 就 是 
BRU 的 所 有 子 集 的 集合 。 这 个 集合 有 时 被 称 为 U KRE (power set), H 27 表示 。 

对 于 了 中 的 所 有 * Aly, «Uy =s RIRE Dy, HE, 并 集运 算 确 定 的 偏 序 为 >, 即 集 合 的 包 
含 关系 。 相 应 地 , 集合 的 交集 运算 确定 的 偏 序 是 ， 即 集合 的 被 包含 关系 。 也 就 是 说 , 对 于 由 交 
集运 算 所 确定 的 偏 序 而 言 ， 元 素 较 少 的 集合 被 认为 是 比较 小 的 值 ; 但 是 对 于 由 并 集运 算 确 定 的 偏 
序 而 言 , 元 素 较 多 的 集合 却 被 认为 是 较 小 的 。 一 个 较 大 的 集合 在 偏 序 中 反而 较 小 是 违反 直觉 的 。 
但 是 根据 前 面 的 定义 , 这 种 情况 是 不 可 避免 的 @。 

9.2 节 中 讨论 过 , 一 个 数据 流 方程 组 通常 有 多 个 解 ， 而 (根据 偏 序 关 系 对 而 言 ) 最 大 的 解 是 最 
精确 的 。 比 如 , 在 到 达 定 值 问题 中 ， 所 有 的 数据 流 方 程 的 解 中 最 精确 的 解 是 具有 最 少 定 值 的 解 ， 
这 个 解 对 应 于 由 此 问题 的 交汇 运算 ( 即 并 集运 算 ) 所 定义 的 偏 序 中 的 最 大 元 素 。 在 可 用 表达 式 中 ， 
最 精确 的 解 是 具有 最 多 表达 式 的 解 。 同 样 ， 它 是 相对 于 由 交集 运算 ( 即 此 问题 的 交汇 运算 ) 定 义 
的 偏 序 的 最 大 解 。 E 

最 大 下 界 

在 交汇 运算 和 它 确定 的 偏 序 之 间 还 有 二 个 有 用 的 关系 。 假设 (V, 人) 是 一 个 半 格 。 域 元 素 x 
All y 的 最 大 下 界 (greatest lower bound, glb) 是 一 个 满足 下 列 条 件 的 元 素 g: 

1) g<x 

ps 

3) 如 果 z 是 使 得 zx H sy 成 立 的 元 素 , 那么 zgo 

我 们 的 结论 是 , x M y 的 交汇 运算 值 就 是 它们 的 唯一 最 大 下 界 。 为 了 说 明 其 中 的 原因 , S 
Es Nys 可 以 观察 到 下 列 性 质 ; 

。 因为 (zxAy) Ax=xAy, RD e<x, 这 个 结论 的 证 明 只 涉及 结合 性 、 可 交换 性 和 等 寡 性 

质 。 也 就 是 ， 
gNx=((xAy) Ax) = (aA (yAx)) = (xA (xAy)) = ((%Ax) Ay) =(xAy) =g 

。 通过 类 似 的 论证 可 以 得 到 g<y。 

o 假设 :是 任意 的 满足 z<x 和 z<y 的 元 素 。 已 知 z<&g, 因此 除非 z 就 是 g, 否则 它 不 是 x 和 
7 的 一 个 最 大 下 界 。 证 明 如 下 : (zAg) =(z 人 (xAy)) =((zAx) Ny), 因为 2<x%; 我 们 
知道 (zAx) =z, 因此 (zAg) =(zAy), AA z<y, 我 们 知道 a 人 y=z， 因此 zAg=z。 我 
们 已 经 证 明了 zsg, 并 且 得 出 结论 g =a Ny fe x Al y 的 唯一 最 大 下 界 。 

并 函数 、 最 小 上 界 和 格 

和 一 个 偏 序 集合 中 的 元 素 的 最 大 下 界 操作 对 应 ， 我 们 可 以 把 元 素 * A y 的 最 小 上 界 (least 
upper bound, lub) 定 义 为 满足 下 列 条 件 的 元 素 5. x<b 且 y<6, 并 且 对 于 任何 满足 x<z Mysz 
的 元 素 z 都 有 4<z。 可 以 证 明 ， 如 果 存 在 最 小 上 界 ， 那么 最 多 只 有 一 个 最 小 上 界 。 

在 一 个 真 的 格 中 有 两 个 域 元 素 上 的 运算 :我 们 已 经 看 到 的 交汇 运算 人 ， 以 及 记 为 V 的 并 
函数 。 并 (join) 函数 给 出 了 两 个 元 素 的 最 小 上 界 。 因 此 格 中 的 元 素 总 是 存在 最 小 上 界 .至今 




















O 并且, 如果 我 们 把 偏 序 定义 为 而 不 是 <， 对 于 并 集 而 言 就 不 会 产生 这 样 的 问题 ， 但 是 对 于 交集 而 言 还 是 会 有 这 
样 的 问题 。 
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为 止 我 们 一 直 讨 论 的 是 “ 半 个 ” 格 , 即 只 存在 交汇 运算 和 并 函数 之 一 。 也 就 是 说 , 我 们 的 半 格 
是 一 个 交 半 格 (meet semilattice) 。 人 们 也 可 以 讨论 并 半 格 (join semilattice ) , 即 只 有 并 函数 的 
半 格 。 实 际 上 有 些 程序 分 析 的 文献 就 使 用 并 半 格 的 概念 。 因为 传统 的 数据 流 文献 讲 的 是 交 半 
格 , 所 以 在 本 书 中 我 们 也 使 用 交 半 格 。 





格 图 
把 域 了 画 成 一 个 格 图 对 我 们 会 有 所 帮助 。 格 图 的 结 点 是 了 的 元 素 ， 而 它 的 边 是 向 下 的 , 即 如 
果 y<x, 那么 从 % 到 YY 有 一 个 边 。 比 如 , 图 9-22 给 出 了 一 个 到 p ET 


达 定 值 数据 流 模式 的 集合 V。 其 中 有 三 个 定 值 : d1、d M dzo Lge ae 
因为 半 格 中 的 偏 序 关系 三 是 了 ,从 这 三 个 定 值 的 集合 的 子 集 到 
其 所 有 超 集 有 一 个 向 下 的 边 。 因 为 < 是 传递 的 , Ra AD 多 i 
条 从 x 到 y 的 路 径 , 我 们 可 以 按照 惯例 省 略 从 * 到 y 的 边 。 因 Le | 
ik, 虽然 在 这 个 例子 中 | di, ds ds| <| dil, 我 们 并 没有 画 出 aa) aa) fe) 
这 条 边 , 因为 这 个 边 可 以 用 经 过 | di, do| 的 路 径 来 表示 。 

有 一 点 也 很 有 用 , 即 我 们 可 以 从 这 样 的 图 中 读 出 交汇 值 。 
Fy x Ny 就 是 它们 的 最 大 下 界 , 因此 这 个 值 总 是 最 高 的 、 从 %* dod) CL) 
和 y 都 有 向 下 的 路 径 到 达 的 元 素 zo 比如 , 如果 * ld, M y 图 9-22” 定 值 的 子 集 的 格 
Eldi, 那么 图 9-22 中 的 z 就 是 |di， dz} 。 这 是 正确 的 , 因为 
这 里 的 交汇 运算 是 并 集运 算 。 顶 元 素 将 出 现在 格 图 的 顶部 , 也 就 是 说 , 从 T 到 图 中 的 每 个 元 素 都 有 
一 条 向 下 的 路 径 。 类 似 地 , 底 元 素 将 出 现在 图 的 底部 , 从 每 个 元 素 都 有 一 条 边 到 达 1。 

乘积 格 

图 9.22 中 只 涉及 了 三 个 定 值 , 而 一 个 典型 程序 的 格 图 可 能 相当 大 。 数 据 流 值 的 集合 是 定 值 
的 雷 集 。 因 此 如 果 一 个 程序 中 有 个 定 值 , 则 该 程序 的 数据 流 值 集 合 包 含 2" 个 元 素 。 但 是 , 一 
个 定 值 是 否 到 达 某 个 程序 点 和 其 他 定 值 的 可 达 性 无 关 。 我 们 因此 可 以 用 “乘积 格 ”的 方式 来 表示 
定 值 的 格 S。 这 个 乘积 格 由 各 个 定 值 对 应 的 简单 格 构造 得 到 。 也 就 是 说 , 如果 程序 中 只 有 一 个 定 
(i d, 那么 相应 的 格 将 只 包括 两 个 元 素 : 空 集 | 1 ( 它 是 项 元 素 ) 以 及 1d| ( 它 是 底 元 素 )。 
严格 地 讲 ， 我 们 按照 下 面 的 方式 构造 乘积 格 。 假 设 14，A4} MIB, Al 是 两 个 ( 半 ) 格 。 这 

两 个 格 的 乘积 格 定义 如 下 :4 

1) 乘积 格 的 域 是 4xB。 
2) 乘积 格 的 交汇 运算 人 定义 如 下 ; 如 果 (a, 8) 和 (a', 以 ) 是 乘积 格 域 中 的 元 素 , 那么 


(a, b) A(a', b’) =(aNga', bA gb’) (9. 19) 
乘积 格 的 偏 序 可 以 很 简单 地 用 4 的 偏 序 <4 和 B 的 偏 序 < 来 表示 : 
(a, b) <(a', b') HEN asja H b<gb' (9. 20) 


为 了 看 出 为 什么 从 式 (9. 19) 可 以 推出 式 (9. 20), 请 注意 下 面 的 性 质 : 

(a, b) Nea, 6) =a Aha", bA 3b’) 
我 们 可 能 会 问 在 什么 情况 下 (a 人 4a’, bA gb’) = (a, b)? SAMY aA ya’ =a HbA pb’ =b 的 时 
候 这 个 等 式 成 立 。 而 这 两 个 条 件 和 a<4a' 和 4b< Bb" 是 一 回 事 。 | 





O 在 这 里 及 以 后 的 讨论 中 , 我们 常常 会 把 “ 半 格 ”中 的 “ 半 ” 字 去 掉 , 因为 像 我 们 现在 讨论 的 那些 格 都 有 一 个 并 (或 者 
说 lub) 运算 符 , 虽然 我 们 不 会 使 用 这 个 运算 符 。 
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格 的 乘积 是 一 个 满足 结合 律 的 运算 ， ERORE A 19) 和 (9. 20) 可 以 被 扩展 到 
任意 多 个 格 。 也 就 是 说 ,如 果 我 们 有 格 (44， 和 NA;) (i=1, 2, =, 上) ,那么 这 个 格 按照 这 个 顺序 
的 乘积 的 域 为 A, XA, x… xA;,, 其 交汇 运算 定义 为 : 

(di, ay, “p ap) Nb, ba, =, be) = (a, N ibi az Naby, +++, a, Nebr) 
而 偏 序 定义 为 
(ai, az, por) <(b,, bs，…, by) 当 且 仅 当 对 于 所 有 的 i a; Sbi 

半 格 的 高 度 

通过 研究 一 个 数据 流 问题 中 的 半 格 的 “高 度 ”, 我 们 可 以 知道 一 些 关于 数据 流 分 析 算 法 收敛 
速度 的 信息 。 偏 序 集 (V, 三 ) 的 二 个 上 升 链 (ascending chain) 是 一 个 满足 x1 <x. <… <x, 的 序列 。 
一 个 半 格 的 高 度 (height) 是 所 有 上 升 链 中 的 < 关系 个 数 的 最 大 值 。 也 就 是 说 , 高 度 比 链 中 的 元 素 
个 数 少 一 。 比 如 , 一 个 有 个 定 值 的 程序 的 到 达 定 值 半 格 的 高 度 是 n。 

如 果 一 个 半 格 具有 有 穷 的 高 度 , 就 可 以 比较 容易 地 证 明 相应 的 办 代数 据 流 算法 的 收 雍 性 ， 
BR, 一 个 由 有 穷 值 集 组 成 的 格 具有 有 穷 的 高 度 ; 一 个 具有 无 穷 多 个 值 的 格 也 可 能 具有 有 穷 的 高 
度 。 在 常量 传播 算法 中 使 用 的 格 就 是 一 个 这 样 的 例子 , 我 们 将 在 9.4 节 中 详细 地 说 明 这 个 例子 。 
9.3.2 传递 函数 

一 个 数据 流 框 架 中 的 传递 函数 族 F: VV RA PSE: 

1) 有 一 个 单元 函数 1, 使 得 对 于 了 中 的 所 有 x, I(x) =%。 

2) 下 对 函数 组 合 运算 封闭 。 也 就 是 说 , UF F PARAS A g, 定义 为 h(x) =g(f(%x)) 
的 函数 疡 也 在 下 中 。 

DE 在 到 达 定 值 中 , 有 单元 函数 ， 即 gen 和 kil 都 是 空 集 的 传递 函数 。 对 函数 组 合 的 封 
闭 性 实际 上 已 经 在 9. 2. 4 节 中 得 到 证 明 , 我 们 在 这 里 简单 地 重复 一 下 证 明 过 程 。 假 设 我 们 县 有 两 
个 函数 

万 (z) =6,U(«%-K,) Al fy («) =G,U(«*-k,) 
那么 
fof, («)) =6,U((G,U(«*-K,)) =R) 
根据 代数 规则 ， 上 式 的 右 部 和 下 式 等 价 ; 
(G,U(G, -K,)) U(*-(K, UK) ) 

MERS K=K UK,, G=6,U(6, -K2), 我 们 就 证 明了 fi WA 的 组 合 f(x) =CU(«- 
K) 的 形式 表明 它 是 下 的 成 员 。 如 果 我 们 考虑 可 用 表达 式 的 问题 ,上面 用 于 到 达 定 值 的 证 明 也 同 
样 可 以 证 明了 具有 单元 函数 并 且 对 函数 组 合 运 算 封 闭 。 CJ 

单调 的 框架 

要 使 得 数据 流 分 析 问 题 的 迭代 算法 能 够 完成 任务 , 我 们 还 要 求 数据 流 框架 再 满足 一 个 条 件 。 
对 于 一 个 框架 , 如 果 框 架 中 的 所 有 传递 函数 都 是 单调 的 , 那么 我 们 就 说 这 个 框架 是 单调 的 。F 中 
的 传递 函数 /是 单调 函数 的 条 件 是 对 于 域 了 中 的 任意 两 个 元 素 , 如 果 第 一 个 元 素 大 于 第 二 个 元 
K, 那么 作用 于 第 一 个 元 素 的 结果 也 大 于 它 作用 于 第 二 元 素 所 得 到 的 结果 。 

正式 的 定义 如 下 , 一 个 数据 流 框架 (D, F, V， 人 \ ) 是 单调 的 (monotone) ， 如 果 


对 于 所 有 的 V 中 的 x 和 yy 以 及 五 中 的 f, x<y BS f(x) <f(y) (9. 22) 
单调 性 可 以 被 等 价 地 定义 为 
对 于 所 有 的 V 中 的 x 和 yy 以 及 中 的 f, f(xAy) <f(x) Afly) (9.23) 


式 (9. 23 ) 说 明 ,， 如 果 我 们 对 两 个 值 应 用 交汇 运算 再 应 用 函数 /, 那么 得 到 的 结果 绝对 不 会 大 
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于 首先 将 了 分 别 应 用 于 两 个 值 ,然后 再 对 结果 应 用 交汇 运算 而 得 到 的 值 。 这 两 个 关于 单调 的 定义 
看 起 来 很 不 相同 ,它们 各 有 各 的 用 处 。 我 们 会 发 现 这 两 个 定义 分 别 适用 于 不 同 的 环境 。 稍 后 我 
们 将 给 出 一 个 简略 的 证 明 , 表明 它们 确实 是 等 价 的 。 
我 们 将 首先 假设 式 (9.22) 成 立 并 证 明 式 (9.23) 成 立 。 因 为 <Ay 是 x 和 y 的 最 大 下 界 , 我 们 知道 
xA\y<«x AxAysy 
因此 由 式 (9. 22) 可 知 : 
Fany) SKa) A flay) SA) 
因为 (x) Afly) ESO MIO RKF A, 我 们 证 明了 (9.23) 0 
反 过 来 , BRAMBLES (9. 23) 成 立 并 证 明 式 (9.22)。 我 们 假设 x*<y 并 使 用 式 (9. 23 ) 来 得 到 
f(x) <f(Y) 的 结论 , 从 而 证 明 式 (9. 22) 。 式 (9.23 ) 告 诉 我 们 
flany) SKa) f(y) 
但 是 因为 我 们 已 经 假设 了 x<y; 根据 定义 有 xAy =xs 因此 , 式 (9.23) 表 明 
fl) <flx) AFO) 
因为 fx) Af(y) 是 f(x) 和 f(y) 的 最 大 下 界 ,我 们 得 到 f(x) A SS) o RFE 
f(x) Sfx) Afly) Sf) 
因此 式 (9. 23) HAR. 22) 。 
可 分 配 的 框架 
数据 流 分 析 框架 经 常会 遵守 一 个 比 式 (9.23) 更 强 的 条 件 ,我 们 把 这 个 条 件 称 为 可 分 配 条 件 
(distributivity condition) ， 即 对 于 了 中 的 所 有 * Aly UR F 中 的 所 有 Jf,， 有 
flay) =f(x) Af) 
当然 , 如 果 a =b, 那么 根据 等 索性 有 Ab = o, 因此 a<b。 这 样 , 可 分 配 性 蕴含 了 单调 性 , 但 是 
反 过 来 并 不 成 立 。 
国信 ;和 :为 到 达 定 值 框架 下 的 定 值 集合 。 令 是 一 个 定义 为 (x) = CU (< - K) 的 函 
数 , 其 中 G 和 天 为 某 个 定 值 的 集合 。 通 过 检验 下 面 的 等 式 
GU((yUz) -K) =(GU(y-K)) U(GU(z-K)) 
我 们 就 可 以 证 明 到 达 定 值 的 框架 满足 可 分 配 性 条 件 。 
虽然 上 面 的 等 式 看 起 来 很 难 , 但 我 们 可 以 首先 考虑 在 6 中 的 那些 定 值 。 这 些 定 值 一 定 都 在 
上 面 等 式 的 左 部 和 右 部 所 定义 的 两 个 集合 中 。 因 此 我 们 只 需要 考虑 不 在 6 中 的 定 值 的 集合 。 
这 种 情况 下 ,我们 可 以 把 C 从 所 有 的 地 方 删除 , 并 验证 等 式 
(yUz) -K=(y-K) U(z-K) 
通过 Venn 图 就 可 以 很 容易 地 验证 这 个 等 式 。 口 
9. 3.3， 通 用 框架 的 迭代 算法 
我 们 可 以 对 算法 9. 11 进行 推广 , 使 之 能 够 处 理 各 种 数据 流 问题 。 
通用 数据 流 框架 的 和 迭代 解法 。 
输入 : 一 个 由 下 列 部 分 组 成 的 数据 流 框架 : 
1) 一 个 数据 流 图 , 它 有 两 个 被 特别 标记 为 ENTRY A EXIT 的 结 点 。 
2) 数据 流 的 方向 D。 
3) 一 个 值 集 。 
4) 一 个 交汇 运算 信 。 
5) 一 个 函数 的 集合 ,其 中 ys 表示 基本 块 B 的 传递 函数 。 
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6) V 中 的 一 个 常量 值 vENTRY 或 者 VEXIT o 它们 分 别 表示 前 向 和 逆向 框架 的 边界 条 件 。 

输出 : 上 述 数 据 流 图 中 各 个 基本 块 B8 的 IN[B] 和 0UT[B] 的 值 。 这 些 值 在 V 中 。 

方法 : 解决 前 向 和 逆向 数据 流 问 题 的 算法 分 别 显示 在 图 9-23a 和 图 9-23b 中 。 和 9.2 节 中 的 各 
个 数据 流 和 迭代 算法 类 似 , 我 们 通过 不 断 近 似 逼 近 的 方式 来 计算 各 个 基本 块 的 让 值 和 0UT 值 。 O 


IN[EXIT] = vexit; 
for (BREXIT 之 外 的 每 个 基本 块 召 ) IN[B] = 
while ( 某 个 IN 值 发 生 了 改变 ) 

for ( 除 EXIT 之 外 的 每 个 基本 块 B ) { 


OUT[ENTRY] = Venray; 
for ( 除 ENTRY 之 外 的 每 个 基本 块 B) OUT[B] = 
while ( 某 个 OUT 值 发 生 了 改变 ) 

for (BR ENTRY 之 外 的 每 个 基本 块 BB) { 


OUT[B] = Assi rican MIS); 


IN[B] = A piepm-rmm OUT[P]; 
IN[B] = fs(OuUT[B]); 


oUT[B] = fa (In[B)); 


} 
a) 前 向 数据 流 问 题 的 迭代 算法 b) 逆向 数据 流 问 题 的 迭代 算法 
图 9-23 ”数据 流 问 题 迭代 算法 的 前 向 和 首 向 的 版 本 


也 可 以 改写 算法 9;25, 使 得 它 把 实现 交汇 运算 的 函数 作为 一 个 参数 , 同时 也 把 实现 各 基本 块 
的 传递 函数 的 函数 作为 参数 。 流 图 本 身 和 边界 值 也 都 作为 参数 。 使 用 这 种 方法 , 编译 器 的 实现 
者 就 可 以 避免 为 编译 器 优化 阶段 所 使 用 的 每 个 数据 流 框架 都 从 头 编写 基本 和 夫 代 算法 的 代码 。 

我 们 可 以 使 用 至 今 为 止 讨论 的 抽象 框架 来 证 明 该 迭代 算法 的 一 组 有 用 的 性 质 : 

1) 如 果 算 法 9. 25 收敛 ; 其 结果 就 是 数据 流 方程 组 的 一 个 解 。 

2) 如 果 框 架 是 单调 的 , 那么 找到 的 解 就 是 数据 流 方程 组 的 最 大 不 动 点 ( Maximum FixedPoint， 
MFP) 。 一 个 最 大 不 动 点 是 一 个 具有 下 面 性 质 的 解 : 在 任何 其 他 解 中 , INLB] 和 OUT[B] 的 值 和 
MFP 中 对 应 的 值 之 间 具 有 关系 。 

3) 如 果 框 架 的 半 格 是 单调 的 , 且 高 度 有 穷 , 那么 这 个 迭代 算法 必定 收敛 

论证 这 些 论点 时 , 我 们 首先 假设 框架 是 前 向 的 。 对 于 北向 框架 的 论证 实质 上 是 一 样 的 。 第 

一 个 性 质 很 容易 证 明 。 如 果 在 while 循环 结束 的 时 候 方 程 组 没有 被 满足 , 那么 各 个 OUT 值 (对 前 
向 框架 ) 或 IN 值 ( 对 逆向 框架 ) 中 至 少 有 一 个 值 改变 了 ，, 我 们 必须 再 次 运行 该 循环 。 

为 了 证 明 第 二 个 性 质 , 我 们 首先 证 明 , 在 运行 算法 迭代 时 任意 的 基本 块 B 的 IN[B] 和 
OUT[B] 所 取 的 值 只 能 (相对 于 格 中 的 和 关系 而 言 ) 下 降 。 这 个 性 质 可 以 通过 归纳 方法 证 明 。 

归纳 基础 : 归纳 的 基础 步 又 是 证 明 IN[B8] 和 0UT[ 8] 的 值 在 第 一 个 迭代 之 后 不 大 于 初始 值 。 
这 个 论断 的 正确 性 是 显而易见 的 , 因为 所 有 不 等 于 ENTRY 的 基本 块 B 的 IN[B] 和 0UT[B] 都 被 
初始 化 为 T。 

归纳 步骤 : 假设 经 过 4 次 迭代 之 后 , 那些 值 都 不 大 于 第 (上 - 1) 次 迭代 后 的 值 , 我 们 要 证 明 第 
k +1 次 迄 代 和 第 次 迭代 相 比 同样 如 此 。 图 9-23a 的 第 5 行 是 : 

IN[B8]=.; /\ OUT[P] 
P 是 B 的 一 个 前 驱 


我 们 用 INLB] 和 0UT[B]i 标记 IN[B] 和 0UT[B] 在 第 i 次 迭代 之 后 的 值 。 假设 OUTP] < 
0UT[ P]*-!, 由 交汇 运算 的 性 质 可 知 IN[B]*+!<IN[B]*。 接 下 来 , 第 (6) 行 说 
OUT[ B] =fs(IN[B]) 
因为 IN[ B]**! <IN[B]*, 由 单调 性 可 知 OUT[ B]*+1<OUT[B]*。 
请 注意 , 每 一 个 IN[B] 和 0OUT[B] 值 的 改变 都 必须 满足 上 述 等 式 。 交 汇 运 算 返 回 的 是 其 输入 
的 最 大 下 界 ， 且 传递 函数 返回 的 值 是 和 基本 块 本 身 及 它 的 给 定 输入 -一致 的 唯一 解 。 因 此 , 如 果 该 
和 迭代 算法 终止 , 其 结果 值 至 少 和 任何 其 他 解 的 相应 值 一 样 大 。 也 就 是 说 ,算法 9. 25 的 结果 是 数 
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据 流 方程 式 的 最 大 不 动 点 。 

最 后 考虑 第 三 点 。 即 数据 流 框架 具有 有 穷 高 度 的 情况 。 因 为 每 个 IN[B] 和 OUT[B] 的 值 在 每 
次 被 改变 时 都 会 减 小 , 而 程序 在 某 一 轮 循 环 中 没有 值 改变 时 就 会 停止 ,因此 算法 的 迭代 次 数 不 会 
大 于 框架 高 度 和 流 图 结 点 个 数 的 乘积 , 因此 算法 必然 终止 。 

9.3.4 “数据 流 解 的 含义 

现在 我 们 知道 使 用 前 面 的 迭代 算法 得 到 的 解 是 最 大 不 动 点 ,但 从 程序 语义 的 角度 来 看 ， 这 个 
结果 又 代表 了 什么 呢 ? 为 了 理解 一 个 数据 流 框架 (D, F, VY， 人 ) 的 解 ,我 们 首先 描述 一 下 一 个 杠 
架 的 理想 解 应 该 是 什么 样子 。 我 们 将 给 出 下 面 的 性 质 , 即 一 般 情 况 下 不 能 得 到 理想 解 , 但 是 算法 
9. 25 保守 地 给 出 了 理想 解 的 近似 值 。 

理想 解 

不 失 一 般 性 , 我 们 假设 现在 感 兴 趣 的 数据 流 框架 是 一 个 前 向 的 数据 流 问 题 。 考 虑 一 个 基本 
块 B 的 人 口 点 。 求 理想 解 的 第 一 步 是 要 找到 从 程序 入 口 到 达 B 的 开头 的 所 有 可 能 的 执行 路 径 。 
只 有 当 程 序 的 某 次 执行 能 够 准确 地 沿 着 某 条 路 径 进 行 , 这 条 路 径 才 被 称 为 “可 能 的 "。 然 后 , 理 
想 的 求解 方法 将 计算 每 个 可 能 路 径 尾 端的 数据 流 值 ， 并 对 这 些 数据 流 值 应 用 交汇 运算 得 到 它们 
的 最 大 下 界 。 那 么 , 程序 的 任何 执行 都 不 可 能 在 该 程序 点 上 产生 一 个 更 小 的 数据 流 值 。 男 外 ,这 
个 界限 还 是 紧 致 的 : 根据 流 图 中 到 达 B 的 所 有 可 能 路 径 计算 得 到 的 数据 流 值 的 集合 的 最 大 下 界 
不 可 能 变 得 更 大 。 

我 们 现在 更 为 正式 地 定义 理想 解 。 对 于 一 个 流 图 中 的 每 个 基本 块 B, $ fe 是 B 的 传递 函数 。 
考虑 任意 从 初始 结 点 ENTRY 到 某 个 基本 块 Bi 中 的 路 径 

P =ENTRY—>B,—B,—-::—>B, _,—>B;, 
程序 的 路 径 可 能 包含 环 , 因此 一 个 基本 块 可 能 在 路 径 已 中 多 次 出 现 ; 定义 已 的 传递 函数 为 
fo, fogs o fo ,的 函数 组 合 的 结果 。 请 注意 , fo 没有 参与 组 合 运算 , 这 表明 这 条 路 径 只 到 达 B, 
的 开头 ,而 不 是 其 结尾 。 执 行 这 条 路 径 而 创建 的 数据 流 值 就 是 fp(venray) ,其 中 wewray 是 代表 初 
始 结 点 ENTRY 的 常 值 传递 函数 的 结果 。 因 此 , 基本 块 8 的 理想 结果 是 


IDEAL[ B] = 
P 基 从 ETNRY 到 8B 的 一 个 可 能 路 径 
按照 问题 中 数据 流 框 架 的 格 理论 偏 序 关系 <, 我 们 有 下 面 的 结论 : 


o 任何 比 IDEAL 更 大 的 答案 都 是 错误 的 。 

。 任何 小 于 或 者 等 于 这 个 理想 值 的 值 都 是 保守 的 , 即 安全 的 。 

直观 地 讲 ， 越 接近 理想 值 的 值 就 越 精 确 。 下 面 说 明 为 什么 方程 的 解 和 理想 值 之 间 必 须 具 有 到 
关系 。 请 注意 , 对 于 任何 基本 块 , 只 要 忽略 程序 可 能 执行 的 某 些 路 径 就 可 能 得 到 该 基本 块 的 大 于 
IDEAL 的 解 。 但 是 , 如 果 我 们 基于 这 样 的 较 大 解 来 改进 代码 , 就 不 能 保证 这 些 被 忽略 的 路 径 中 一 
定 不 会 有 某 些 执行 效果 使 得 我 们 的 代码 改进 不 正确 。 反 过 来 , 任何 小 于 IDEAL 的 值 都 可 以 被 看 
作 是 包含 了 某 些 不 必要 的 路 径 , 它们 可 能 是 流 图 中 不 存在 的 路 径 , 也 可 能 流 图 中 存在 此 路 径 但 程 
序 却 不 会 按 这 条 路 径 执行 。 这 些 较 小 的 解 将 只 允许 进行 对 程序 的 所 有 可 能 执行 都 正确 的 转换 ， 
但 是 它们 会 禁止 IDEAL 值 原本 允许 的 某 些 转换 。 

基于 路 径 交 汇 运算 的 解 

但 是 正如 9.1 节 中 所 讨论 的 , 寻找 所 有 可 能 的 执行 路 径 是 一 个 不 可 判定 问题 。 因 此 , 我 们 必 


fp ( VENTRY ) 





© 请 注意 , 在 一 个 前 向 的 问题 中 , 我 们 希望 IN[ 8] 的 值 等 于 IDEAL B] 的 值 。 我 们 没有 在 这 里 讨论 逆向 的 问题 。 在 
逆向 的 问题 中 , 我 们 把 IDEAL[TB] 定 义 为 OUT[B] 的 理想 值 。 
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须 使 用 近似 方法 。 在 数据 流 抽象 中 , 假设 流 图 中 的 每 条 路 径 都 可 能 被 执行 a 因此 ; 我 们 可 以 用 如 
下 方法 定义 B 的 基于 路 径 交 汇 运算 的 解 。 
MOP[ B] = /\ fp (ventry ) 
P 是 从 ETNRY 到 8B 的 一 个 流 图 路 径 

请 注意 ， 和 前 面 讨论 IDEAL 时 一 样 ， Mera e 如 果 我 
们 要 考虑 反 向 数据 流 框架 , 那么 我 们 会 把 MOP[B] 当 作 OUTI B] WE. 

在 MOP 解 中 考虑 的 路 径 是 所 有 可 能 被 执行 路 径 的 超 集 。 因 此 , MOP 解 中 交汇 运算 的 输入 不 
仅 包括 所 有 可 执行 路 径 的 数据 流 值 , 还 包括 了 一 些 和 不 可 能 执行 路 径 相 关 的 数据 流 值 。 把 理想 
解 和 一 些 其 他 的 值 进行 交汇 运算 不 可 能 创造 出 一 个 大 于 理想 值 的 解 。 因 此 , 对 所 有 的 B, 我们 有 
MOP[B] <IDEAL[ B]。 我 们 简单 地 说 MOP<IDEAL, 

最 大 不 动 点 和 MOP 解 

HER, 如 果 流 图 包含 环 , 那么 在 MOP 解 中 需要 考虑 的 路 径 数量 仍然 是 无 界 的 。 因 此 , 不 能 
直接 由 MOP 的 定义 得 到 算法 。 当 然 , 迭代 算法 也 不 是 先 找 到 所 有 到 达 一 个 基本 块 的 路 径 , 然后 
再 应 用 交汇 运算 的 , 而 是 采用 如 下 方法 : 

1) 这 个 迭代 算法 访问 各 个 基本 块 , 其 访问 的 顺序 并 不 一 定 是 执行 的 顺序 。 

2) 在 每 个 路 径 交汇 点 , 算法 对 当前 已 经 得 到 的 数据 流 值 应 用 交汇 运算 。 其 中 一 部 分 被 使 用 
的 值 可 能 是 在 初始 化 过 程 中 人 为 加 入 的 , 并 不 表示 从 程序 开始 的 执行 结果 。 

那么 , MOP 解 和 算法 9. 25 产生 的 MFP 解 之 间 有 何 关系 呢 ? 

我 们 首先 讨论 一 下 访问 结 点 的 顺序 。 在 一 次 迭代 中 , 我 们 可 能 在 访问 一 个 结 点 的 前 驱 之 前 
就 访问 这 个 结 点 。 如 果 其 前 驱 为 ENTRY 结 点 , OUT[ ENTRY ] 已 被 初始 化 为 正确 的 常量 值 。 其 他 
结 点 的 OUT 值 被 初始 化 为 项 元 素 T, 这 个 值 不 小 于 最 后 的 结 
果 。 由 单调 性 可知, 使 用 T 作 为 输入 得 到 的 结果 不 小 于 期 望 
解 。 从 某 种 意义 上 说 , 我 们 把 T 当 作 表 示 不 包含 任何 信息 B) 
的 值 。 

提前 应 用 交汇 运算 的 效果 是 什么 呢 ? 考虑 图 9-24 中 的 简 
单 例子 , 并 假设 我 们 对 IN[B4 |] 的 值 感 兴趣 。 根 据 MOP 的 
定义 : 

MOP[ B4 ] =(( °fp,) A Sa, °fB,))(vENTRY) 
在 迭代 算法 中 , WR PATE Bi, Bl. B3, By 的 顺序 访问 结 
点 ,那么 图 9-24， 说 明 提前 应 用 路 径 
IN[ By] =fp, ( Sp, (veNrRY ) Afa, (ventry) )) 交汇 运算 的 效果 的 流 图 

在 MOP 的 定义 中 最 后 才 应 用 交汇 运算 , 而 迭代 算法 则 提早 使 用 这 个 函数 。 只 有 当 数 据 流 框 
架 为 可 分 配 时 得 到 的 解 才 是 相同 的 。 如 果 一 个 数据 流 框 架 单 调 但 不 可 分 配 , 我 们 仍然 有 IN[ B, ] 
和 MOP[B4]。 回 忆 一 下 ,总 的 来 说 ， 如 果 对 所 有 的 基本 块 呈 都 有 JINLB] <IDEAL[B], 那么 这 个 
解 就 是 安全 的 (保守 的 )。 这 个 解 当然 是 安全 的 , 因为 MOP[B] <IDEAL[B], 

我 们 现在 简略 说 明 一 下 为 什么 从 代 算法 提供 的 MPP 解 总 是 安全 的 。 对 i 进行 简单 的 归纳 就 
可 以 表明 在 第 i 次 迭代 之 后 得 到 的 值 小 于 或 等 于 对 所 有 长 度 小 于 等 于 i 的 路 径 进 行 交汇 运算 而 得 
到 的 值 。 但 是 当 和 迭代 算法 终止 的 时 候 ， 它 得 到 的 值 和 再 进行 任意 多 次 迭代 所 得 到 的 值 相同 。 因 
此 其 结果 不 会 大 于 MOP 解 。 因 为 MOP<IDEAL H MFP<MOP, 我 们 知道 MFP<IDEAL, 因此 由 
迭代 算法 提供 的 MFP 解 是 安全 的 。 
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9.3.5 9.3 节 的 练习 

练习 9. 3. 1 : 构造 一 个 三 个 格 的 乘积 的 格 图 。 其 中 的 每 个 格 都 是 基于 单一 定 值 d;(i=1, 2, 3)。 
得 到 的 格 图 和 图 9-22 中 的 格 图 有 什么 关系 ? 

| 练习 9, 3.2: 在 9.3.3 节 中 , 我 们 说 如 果 框架 具有 有 限 的 高 度 , BARRA. AE 
给 出 一 个 框架 没有 有 限 高 度 且 迭代 算法 也 不 收敛 的 例子 。 令 值 集 V 是 非 负 实数 , 令 交 汇 运算 为 
取 最 小 值 运算 。 有 三 个 传递 函数 : 

1) 单元 函数 广 (x) =x 

2)“ 半 ”函数 , 即 函 数 fy(x) =%/2。 

3)“ 一 ”函数 , 即 函 数 fo(x) =1。 

传递 函数 的 集合 正 是 这 三 个 函数 以 及 它们 按照 各 种 可 能 方式 组 合 得 到 的 函数 。 

1) 描述 函数 集 Fo 

2) 这 个 框架 的 二 关系 是 什么 ? 

3) 给 出 一 个 流 图 并 在 流 图 的 各 个 结 点 上 赋予 传递 函数 ,使 得 算法 9. 25 对 这 个 流 图 不 收敛 。 

4) 这 个 框架 是 单调 的 吗 ? 它 是 可 分 配 的 吗 ? 

| 练习 9. 3. 3; 我 们 说 如 果 框 架 单调 且 具 有 有 限 高 度 , 那么 算法 9. 25 收敛 。 这 里 给 出 一 个 
框架 的 例子 。 它 说 明 单调 性 是 很 重要 ,有 穷 高 度 不 足以 保证 算法 收敛 。 这 个 框架 的 域 V 是 |1， 
2} , 交汇 运算 是 min, 而 函数 集 正 只 有 单元 函数 (万 ) 和 “替换 ”函数 (fs(*) =3 -*)， 它 的 功能 是 使 
得 值 在 1 和 2 之 间 互 换 。 

1) 说 明 这 个 框架 具有 有 限 高 度 , 但 是 不 单调 。 

2) 给 出 一 个 流 图 的 例子 , 并 给 每 个 结 点 赋予 一 个 传递 函数 , 使 得 算法 9.25 对 这 个 流 图 不 

| 练习 9. 3.4: 令 MOP,[B] 为 所 有 从 程序 人口 结 点 到 达 基 本 块 B 的 长 度 不 大 于 i 的 路 径 的 交 
汇 运算 结果 值 。 证 明 在 算法 9.25 和 迭代; 次 之 后 ,IN[B] <MOP;[B]。 同 时 证 明 , 作为 上 面 结论 
的 推论 , 如 果 算 法 9. 25 收敛 , 它 必然 收敛 于 某 个 和 MOP 解 具有 三 关系 的 值 。 

1 练习 9. 3.5: 假设 一 个 框架 的 传递 函数 集合 具有 gen-kill 形式 。 也 就 是 说 , 域 了 是 某 个 
FARRE, 而 Kx) =GU(x-K), 其 中 G 和 KK 是 两 个 集合 。 证 明 如 果 交 汇 运算 是 并 集运 算 或 交 
集运 算 , 框架 都 是 可 分 配 的 。 


9.4 常量 传播 


在 9.2 节 中 讨论 的 所 有 数据 流 模式 实际 上 都 是 具有 有 限 高 度 的 可 分 配 框架 的 简单 例子 。 这 
样 ,迭代 算法 9.25 的 前 向 或 逆向 版 本 可 以 用 来 解决 这 些 问题 , 并 求 出 每 个 问题 的 MOP 解 。 在 本 
节 中 , 我 们 将 深入 研究 一 个 具有 更 多 有 趣 性 质 的 有 用 的 数据 流 框架 。 

回忆 二 下 常量 传播 (或 者 说 “常量 折合"), 即 把 那些 在 每 次 运行 时 总 是 得 到 相同 常量 值 的 表 
达 式 替换 为 该 常量 值 ,下面 描述 的 常量 传播 框架 和 至 今 已 经 讨论 的 数据 流 问题 都 有 所 不 同 。 不 
同 之 处 在 于 : 

1) 它 的 可 能 数据 流 值 的 集合 是 无 界 的 。 即 使 对 于 一 个 确定 的 流 图 也 是 如 此 。 

2) 它 不 是 可 分 配 的 。 

常量 传播 是 一 个 前 向 数据 流 问题 。 表 示 此 问题 数据 流 值 的 半 格 和 问题 的 传递 函数 族 在 下 面 
给 出 5 
9. 4.1 常量 传播 框架 的 数据 流 值 

这 个 问题 的 数据 流 值 的 集合 是 一 个 乘积 格 ， 其 中 每 个 分 量 对 应 于 程序 中 的 一 个 变量 。 单 个 
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变量 的 格 由 下 列 元 素 组 成 : 

1) 所 有 符合 该 变量 的 类 型 的 常量 值 。 

2) {Ë NAC, 即 not-a-constant, 表示 非常 量 值 。 当 确定 一 个 变量 的 值 不 是 常量 值 时 , 该 变量 就 
被 映射 到 值 NAC。 这 个 变量 被 映射 到 NAC 值 的 原因 可 能 是 它 被 赋予 了 一 个 输入 变量 的 值 , 或 者 
它 从 一 个 不 具 常 量 值 的 变量 中 获得 值 , 也 可 能 是 在 到 达 同 一 程序 点 的 不 同 路 径 上 被 赋予 不 同 的 
常量 值 。 

3) (E UNDEF, 代表 未 定义 。 如 果 还 不 能 确定 任何 有 关 这 个 变量 的 信息 , 就 把 它 映射 到 这 个 
值 上 。 原 因 很 可 能 是 还 没有 发 现 有 哪个 对 这 个 变量 的 定 值 能 够 到 达 问 题 中 的 程序 点 。 

请 注意 , NAC 和 UNDEF BARN, 实质 上 它们 是 对 立 的 。NAC 说 我 们 已 经 知道 一 个 变量 有 
多 种 定 值 方式 , 因此 我 们 知道 它 不 是 常量 ; UNDEF 是 说 有 关 这 个 变量 我 们 知道 得 非常 少 , 以 至 于 
我 们 根本 不 能 确定 任何 事情 。 

一 个 典型 的 整数 类 型 变量 的 半 格 如 图 9-25 所 示 。 这 里 , 顶 元 素 是 UNDEF, 底 元 素 是 NAC, 
也 就 是 说 , 半 格 的 偏 序 的 最 大 值 是 UNDEF, 最 小 值 是 NAC。 其 他 的 常量 值 是 无 序 的 , 但 是 它们 都 
比 UNDEF 小 而 比 NAC 大 。 如 9, 3. 1 节 所 讨论 的 , 两 个 值 的 交 是 它们 的 最 大 下 界 。 因 此 , 对 于 所 


有 的 值 w 有 
UNDEF Av =v H NAC Av = NAC UNDEF 
对 于 任意 的 常量 c, 有 SS 


c 人 Ace=e 
EE po go! gay 


且 给 定 两 个 不 同 的 常量 ci Meo, 有 se. ae tas 

这 个 框架 中 的 一 个 数据 流 值 是 从 程序 中 的 各 个 变量 NAC 
到 上 面 的 常量 半 格 中 的 某 个 值 的 映射 。 变 量 v 在 一 个 映 ns ”表示 了 一 个 整数 类 型 变量 
AY m 中 的 值 记 为 m(w)。 的 所 有 可 能 “ 取 值 ”的 半 格 
9. 4.2 常量 传播 框架 的 交汇 运算 

这 个 数据 流 问题 的 数据 流 值 的 半 格 就 是 图 9-25 中 所 示 半 格 的 乘积 , 对 于 每 个 变量 有 一 个 图 
9-25 中 所 示 的 半 格 。 因 此 , m<m' 当 上 且 仅 当 对 于 所 有 的 变量 v 都 有 m(v) <m'(v)。 换 旬 话 说 ， 
mAm’ =m" 当 且 仪 当 对 于 所 有 的 变量 v, m(v) Am'(v) =m"(v)。 
9.4.3 常量 传播 框架 的 传递 函数 

下 面 我 们 假设 一 个 基本 块 只 包含 一 个 语句 。 包 合 多 个 语句 的 基本 抉 的 传递 函数 可 以 通过 
将 各 个 语句 对 应 的 传递 函数 组 合 起 来 而 构造 得 到 。 函 数 集合 下 由 一 组 传递 函数 组 成 ， 这 些 传 
递 函数 接受 的 输入 是 一 个 从 程序 变量 到 常量 格 中 元 素 的 映射 ， 而 其 返回 值 则 是 另 一 个 这 样 的 
映射 。 

包含 一 个 单元 函数 , 它 接受 一 个 映射 作为 输入 并 返回 相同 的 映射 。F 也 包含 了 对 应 于 EN- 
TRY 结 点 的 常 值 传递 函数 。 这 个 传递 函数 对 于 任意 的 输入 映射 都 返回 映射 mo, 而 对 于 所 有 的 变 
fit v, mo(v) =UNDEF。 因 为 在 执行 任何 程序 语句 之 前 任何 变量 都 没有 定义 , 因此 这 个 边界 条 件 
是 合理 的 。 

一 般 来 说 , 令 A 为 语句 s 的 传递 函数 , 并 令 m 和 m' 表 示 满 足 m'=f.(m) 的 两 个 数据 流 值 。 我 
们 将 用 mw 和 m' 之 间 的 关系 来 描述 f,。 

1) WR s 不 是 一 个 赋值 语句 , 那么 f, 就 是 单元 函数 。 

2) WÈ s 是 一 个 对 变量 * 的 赋值 , 那么 对 于 所 有 变量 v 关 x, m (v) =m(v); 其 中 m'(x) 的 定 
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义 如 下 : 

@ 如 果 语 句 s 的 右 部 (RHS) 是 一 个 常量 c, IRA m(x) =e. 

® 如 果 RHS 形 如 7 +29, 那么 

m(y) +m(z) 如 果 m(y) 和 m(z) 都 是 常量 值 
m' (x) -fac 如 果 m(y) 或 者 m(z) 是 NAC 
UNDEF 否则 

© 如 果 RHS 是 其 他 表达 式 ( 比如 一 个 函数 调用 , 或 者 使 用 指针 的 赋值 ), IA m(x) = NAC. 
9.4.4 常量 传递 框架 的 单调 性 

现在 我 们 来 证 明 常 量 传递 框架 是 单调 的 。 首 先 , 我 们 可 以 考虑 一 个 函数 人 对 于 单个 变量 的 
影响 。 除 了 情况 2(b) 之 外 , f, 要 么 没有 改变 m(%) 的 值 , BAI x 的 映射 值 改 成 一 个 常量 或 者 
NAC。 在 这 些 情况 下 , f, 无 疑 是 单调 的 。 

对 于 情况 2(b) , 的 影响 如 图 9-26 所 示 。 第 一 列 和 
第 二 列 代表 y 及 z 的 可 能 输入 值 , 最 后 一 列表 示 x 的 输出 
值 。 每 列 (或 者 每 个 子 列 ) 中 的 值 按照 从 大 到 小 的 方式 排 
列 。 为 了 说 明 函 数 的 单调 的 ,我们 将 检验 下 面 的 性 质 ， 即 









me) | me] 
[UNDEF || UNDEF 
e one 
NAG || ac 
| 
Be 













对 于 y 的 每 个 可 能 的 输入 值 , x 的 值 不 会 在 > 值 变 小 的 时 Pora 
候 变 大 。 比 如 , 在 y 具有 常量 值 ci 的 情况 下 , 4 z 的 值 从 ce a 





UNDEF 变 为 、 再 变 为 NAC 时 , x 的 取 值 相应 地 从 UN- 
DEF 变 为 c + co、 再 到 NAC。 我 们 可 以 对 y 的 所 有 可 能 取 
值 重复 这 个 检验 过 程 。 因 为 对 称 性 , 我 们 甚至 不 需要 对 
第 一 个 运算 分 量 重复 这 个 过 程 就 可 以 得 出 结论 ; 当 输 入 图 926 X=Y + 2 的 常量 传播 函数 
变 小 的 时 候 输出 不 会 变 大 。 
9.4.5 ”常量 传播 框架 的 不 可 分 配 性 

上 面 定义 的 常量 传播 框架 是 单调 的 , 但 不 是 可 分 配 的 。 也 就 是 说 , 迭代 解 MFP 是 安全 的 , 但 
是 可 能 比 MOP 解 小 。 可 以 用 一 个 例子 来 证 明 这 个 框架 不 是 可 分 配 的 。 
PEN 在 图 9.27 的 程序 中 , x Aly 在 基本 块 B, 中 被 分 别 设置 为 2 和 3, 而 在 基本 块 B 中 被 
分 别 设置 为 3 和 2。 我 们 知道 , 不 管 按照 哪 条 路 径 执行 , 在 基本 块 B 的 结尾 处 z 的 值 都 是 5。 但 
E, 上面 的 迭代 算法 没有 发 现 这 个 事实 。 相 反 地 , CE B, 的 入 口 处 应 用 交汇 运算 , 并 把 x 和 y 的 
值 都 设置 为 NAC。 因 为 两 个 NAC 相 加 的 结果 还 是 NAC, 算法 9.25 在 程序 的 出 口 处 产生 的 输出 是 
z= NAC。 这 个 结果 是 安全 的 , 但 是 不 够 精确 。 算 法 9.25 不 够 精确 的 原因 是 它 没 有 跟踪 * 和 7 之 
间 的 相关 性 : 当 x 是 2 时 y 必 然 是 3; 而 当 x 是 3 时 y 必然 是 2。 可 以 使 用 一 个 更 加 复杂 的 框架 来 
跟踪 包含 程序 变量 的 表达 式 之 间 的 相等 关系 , 但 是 这 个 方法 的 代价 要 高 得 多 。 这 个 方法 将 在 练 
习 9.4.2 中 讨论 。 

理论 上 讲 , 我 们 可 以 把 精确 度 的 丧失 归 因 于 常量 传播 框架 的 不 可 分 配 性 。 令 万 、 广 、 方 分 
别 是 代表 基本 块 By. By. By 的 传递 函数 。 如 图 9-28 所 示 ， 

filmo) Afa (mo) ) <h (fı (mo) ) Af (plmo)) 

体现 了 这 个 框架 的 不 可 分 配 性 。 口 


| 
enoe NAc | 
| 
| 


1 





O ”和 往常 一 样 ，+ 表示 一 个 一 般 性 的 运算 符号 ， 而 不 是 只 表示 加 法 。 
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mo 
fi(mo) 
f2(mo) 


fi(mo) A fo(mo) 
fs(fi oe fa(mo)) 











EXIT 








图 ,9-27， 一 个 说 明 常 量 传播 框架 不 可 分 配 的 例子 图 9-28 不 可 分 配 的 传递 函数 的 例子 


9.4.6 ”对 算法 结果 的 解释 

在 迭代 算法 中 使 用 值 UNDEF 有 两 个 目的 : 初始 化 ENTRY 结 点 , 以 及 在 迭代 之 前 对 程序 内 部 
的 点 进行 初始 化 。UNDEF 在 这 两 种 情况 下 的 含义 略 有 不 同 。 第 一 种 情况 是 说 变量 在 程序 开始 执 
行 的 时 候 是 没有 定 值 的 ; 第 二 种 情况 是 表示 因为 在 迭代 过 程 开始 的 时 候 缺 乏 信息 ,因此 我 们 把 解 
近似 估算 为 顶 元 素 UNDEF。 在 迭代 过 程 结束 后 , 在 ENTRY 结 点 的 出 口 处 各 个 变量 的 值 仍然 是 
UNDEF, 因为 OUTI ENTRY ] 不 会 改变 。 

UNDEF 值 也 可 能 出 现在 某 些 其 他 的 程序 点 上 。 它 们 的 出 现 意味 着 在 到 达 该 程序 点 的 所 有 路 
径 中 尚未 发 现任 何 对 该 变量 的 定 值 。 请 注意 , 根据 我 们 定义 交汇 运算 的 方式 , 只 要 有 一 个 对 该 变 
量 定 值 的 路 径 到 达 该 程序 点 , 变量 的 值 就 不 是 UNDEF 了 。 如 果 到 达 一 个 程序 点 的 所 有 定 值 都 有 
同样 的 常量 值 , 那么 即使 该 变量 可 能 在 某 些 路 径 上 没有 被 定 值 , 它 仍然 会 被 当 作 是 常量 。 

如 果 假 设 被 分 析 的 程序 是 正确 的 , 我 们 的 算法 就 可 以 发 现 比 不 做 这 个 假设 时 更 多 的 常量 。 
也 就 是 说 , 我 们 的 算法 会 为 可 能 未 定 值 的 变量 选择 适当 的 值 , 以便 程序 能 够 更 加 高 效 地 执行 。 在 
大 多 数 程序 设计 语言 中 , 这 种 改变 是 合法 的 , 因为 在 这 些 语言 中 未 定 值 的 变量 可 以 取 任 何 值 。 如 
果 语 言 的 语义 要 求 所 有 未 定 值 的 变量 取 某 个 特定 的 值 , 那么 我 们 就 必须 相应 地 改变 在 这 个 数据 
流 问 题 中 使 用 的 公式 。 如 果 我 们 对 寻找 程序 中 可 能 未 定 值 的 变量 感 兴趣 ,就 可 以 用 公式 刻画 出 
一 个 不 同 的 数据 流 分 析 问题 ， 以 提供 相应 的 结果 ( 见 练习 9.4.1) 。 
在 图 9-29 中 , 变量 * 在 基本 块 B, 和 已 
的 出 口 处 的 值 分 别 为 10 和 UNDEF。 因 为 UNDEF A 
10 =10, x 在 基本 块 B, 的 人 口 点 的 值 是 10。 因 此 可 B, 
以 在 使 用 x 的 基本 块 Bs 中 把 x 替换 为 常量 10, 从 而 
对 Bs 进行 优化 。 如 果 被 执行 的 路 径 是 B,>B,—8B, 
>B; , 那么 到 达 基 本 块 Bs 时 x 的 值 尚未 定 值 。 因 此 
JEX x 的 使 用 替换 为 10 看 起 来 是 不 正确 的 。 

但 是 如 果断 言 0' 为 真 时 断言 0 不 可 能 为 假 , 那 B 
么 这 个 执行 路 径 实 际 上 不 可 能 出 现 。 虽 然 程序 员 可 
能 知道 这 个 事实 , 但 判定 这 个 事实 已 经 超出 了 任何 
数据 流 分 析 技术 的 能 力 。 因 此 ,如果 我 们 假设 程序 
是 正确 的 , 并 且 所 有 变量 在 被 使 用 之 前 都 已 经 定 值 ， 
那么 x 在 基本 块 By 开始 处 的 值 只 能 是 10。 如 果 程 ”图 9-29 UNDEF 和 一 个 常量 值 的 交汇 运算 值 
序 一 开始 就 是 不 正确 的 , 那么 选择 10 作为 x 的 值 不 可 能 比 允 许 * 取 随机 值 的 效果 更 糟 。 oO 
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9.4.7 9.4 节 的 练习 

| 练习 9. 4. 1: 假设 我 们 希望 检测 一 个 变量 是 否 有 可 能 在 尚未 初始 化 的 情况 下 到 达 某 个 使 用 
它 的 程序 点 。 你 将 如 何 修改 本 节 中 的 框架 来 检测 这 种 情况 ? 

1) 练习 9. 4. 2: 在 一 个 有 趣 且 功能 强大 的 数据 流 分 析 框 架 中 , 值 域 V 是 对 表达 式 的 所 有 可 
能 的 分 划 。 两 个 表达 式 在 此 分 划 的 同一 个 等 价 类 中 当 且 仅 当 沿 着 任何 路 径 到 达 问 题 中 的 程序 点 
时 它们 一 定 具 有 相同 的 值 。 为 了 避免 列 出 无 穷 多 个 表达 式 , 我 们 可 以 只 列 出 最 少 的 等 值 表达 式 
对 来 表示 V。 比 如 ,如果 我 们 执行 语句 


a=b 
c=atd 


WKAR) WMA RAR MRS a=b, c=a - d|。 从 这 些 表 达 式 对 可 以 推出 其 他 的 等 值 关 
AR, 比如 c=b+d 和 a+e=6b+e 等 , 但 是 没有 必要 明确 地 把 这 些 表达 式 都 列 出 来 。 

1) 适用 于 这 个 框架 的 交汇 运算 是 什么 ? 

2) 给 出 一 个 数据 结构 来 表示 域 中 的 值 , 并 给 出 一 个 算法 来 实现 交汇 运算 。 

3) 适用 于 各 个 语句 的 传递 函数 是 什么 ? 解释 一 下 a =b +c 这 样 的 语句 对 于 一 个 表达 式 分 划 
( 即 V 中 的 一 个 值 ) 的 影响 。 

4) 这 个 框架 是 单调 的 吗 ? 是 可 分 配 的 吗 ? 


9.5 “部 分 元 余 消 除 


在 本 节 中 , 我 们 详细 考虑 如 何 尽量 减少 表达 式 求 值 的 次 数 。 也 就 是 说 , 我 们 希望 考虑 一 个 
流 图 中 所 有 可 能 的 执行 顺序 并 检查 x + y 这 样 的 表达 式 被 求 值 的 次 数 。 通 过 移动 各 个 对 x+y 
求 值 的 位 置 , 并 在 必要 时 把 求 值 结果 保存 在 临时 变量 中 , 我 们 常常 可 以 在 很 多 执行 路 径 中 减 
少 这 个 表达 式 被 求 值 的 次 数 , 并 保证 不 增加 任何 路 径 中 的 求 值 次 数 。 请 注意 , 在 流 图 中 x+y 
被 求 值 的 位 置 可 能 增多 , 但 是 相对 来 说 这 一 点 并 不 重要 , 只 要 对 表达 式 x+y 求 值 的 次 数 被 减 
少 就 行 了 。 

应 用 本 节 开发 的 代码 转换 可 以 提高 所 生成 的 代码 的 性 能 。 这 是 因为 ,正如 我 们 即将 看 到 的 ， 
在 改进 后 的 代码 中 , 只 有 在 绝对 必要 时 才 会 进行 一 次 运算 。 每 个 优化 编译 器 都 或 多 或 少 地 实现 
了 本 节 中 描述 的 转换 , 虽然 有 些 编译 器 使 用 的 算法 没有 本 节 中 的 算法 那么 “激进 "。 但 是 , 还 有 
另 一 个 动机 促使 我 们 来 讨论 这 个 问题 。 在 流 图 中 寻找 (一 个 或 多 个 ) 适当 的 位 置 来 对 各 个 表达 式 
求 值 需要 进行 四 种 不 同 的 数据 流 分 析 。 因 此 ， 对 “部 分 宛 余 消 除 ”( 即 尽量 减少 表达 式 求 值 次 数 的 
技术 ) 的 研究 可 以 帮助 我 们 理解 数据 流 分 析 技术 在 编译 器 中 所 扮演 的 角色 。 

程序 中 的 完 余 以 多 种 形式 存在 。 如 9. 1. 4 节 所 讨论 的 ， 它 可 能 以 公共 子 表达 式 的 形式 存在 ， 
即 对 表达 式 的 多 次 求 值 产 生 同 样 的 结果 。 它 也 可 能 以 循环 不 变 表达 式 的 方式 存在 , 这 个 表达 式 
在 循环 的 每 次 选 代 中 都 得 到 相同 的 值 。 完 余 也 可 能 是 部 分 性 的 ， 即 只 能 在 部 分 路 径 而 不 是 全 部 
路 径 中 找到 这 个 元 余 。 公 共 子 表达 式 和 循环 不 变 表达 式 可 以 被 看 作 是 部 分 宛 余 的 特例 ， 因 此 可 
以 设计 一 个 部 分 宛 余 消除 算法 来 消除 不 同 种 类 的 元 余 。 

EFK, 我 们 首先 讨论 元 余 的 不 同形 式 , 以 便 对 这 个 问题 有 直观 的 理解 。 然 后 再 描述 一 般 性 
的 宛 余 消 除 问题 , 并 在 最 后 给 出 解决 问题 的 算法 。 这 个 算法 很 有 意思 , 因为 它 涉及 多 种 数据 流 问 
题 的 求解 。 这 些 问题 中 既 有 前 向 问题 , 也 有 逆向 问题 ， 

9.5.1 宛 余 的 来 源 

图 9-30 HART ARM SA: 公共 子 表达 式 、 循 环 不 变 表达 式 和 部 分 元 余 表达 式 。 该 图 

中 给 出 了 优化 之 前 和 之 后 的 代码 。 
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a) 公共 子 表达 式 b) 循环 不 变 代码 移动 c) 部 分 元 余 消 除 
图 9-30 各 种 宛 余 的 例子 


全 局 公共 子 表达 式 

在 图 9-30a F, 基本 块 B, 中 计算 的 表达 式 b+c 是 元 余 的 。 不 管 按照 哪 条 路 径 ， 当 控制 流 到 
KB, 时 这 个 表达 式 在 之 前 已 经 被 求 过 值 了 。 正 如 我 们 在 这 个 例子 中 观察 到 的 , 在 不 同 的 路 径 上 
表达 式 可 能 取 不 同 的 值 。 我 们 可 以 按照 下 面 的 方法 优化 代码 。 在 基本 块 B; 和 B, 中 把 b+c 的 计 
算 结 果 存 放 到 同一 个 临时 变量 (比如 说 切中 。 然 后 在 基本 块 B4 中 不 再 重新 计算 这 个 表达 式 , 而 
是 直接 把 i 的 值 赋 给 e。 如 果 在 对 5+c 的 最 后 一 次 求 值 之 后 以 及 基本 块 B, 之 前 对 5 或 c 有 一 个 
赋值 运算 , 那么 By 中 的 这 个 表达 式 就 不 再 是 宛 余 的 。 

正式 地 讲 , 如 果 按 照 9.2.6 节 的 说 法 , 一 个 表达 式 b+c 在 程序 点 五 止 是 一 个 可 用 表达 式 ， 我 
们 就 说 该 表达 式 在 该 点 上 是 (完全 ) 兄 余 的 。 也 就 是 说 , 在 所 有 到 达 p MRAP, 表达 式 8+c 已 
经 被 求 过 值 , 并 且 在 最 后 一 次 求 值 之 后 变量 8 和 < 没有 被 重新 定 值 。 后 一 个 条 件 是 必须 的 , 因为 
虽然 从 字面 上 看 表达 式 +e 在 到 达 点 p 时 已 经 执行 过 了 , 但 在 p 点 计算 得 到 的 6+6 的 值 可 能 是 
不 同 的 ; 因为 运算 分 量 可 能 已 经 改变 了 。 


寻找 “深层 "公共 子 表达 式 
使 用 可 用 表达 式 分 析 来 寻找 元 余 表达 式 时 只 能 够 找 出 字面 上 相同 的 可 用 表达 式 。 比 如 ， 
如 果 两 个 代码 片断 


th =D. 4 Cs #8 = tl +d; 














和 


t2.= bitec nea) t2 + d; 
CIB] b 和 < 没有 被 重新 定 值 , AKAN FASE Pe AT RT A eB ZEB — SH Di HY tl 
和 第 二 个 代码 片断 中 的 刀具 有 相同 的 值 。 但 是 它 无 法 发 现 a Ae 的 值 也 相同 。 如 果 要 找 出 这 
一 类 “深层 ”的 公共 子 表达 式 , 我 们 可 以 重复 应 用 公共 子 表达 式 消除 技术 , 直到 某 一 次 应 用 时 
找 不 到 新 的 公共 子 表达 式 为 止 。 另 一 种 可 能 的 方法 是 使 用 练习 9.4.2 中 的 框架 来 找 出 “深层 ” 
公共 于 表达 式 。 








fh et 
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循环 不 变 表达 式 

图 9-30b 给 出 了 三 个 循环 不 变 表达 式 的 例子 。 假 设 变量 和 。 在 循环 中 没有 被 重新 定 值 , H 
Z b + c 就 是 循环 不 变 的 。 我 们 可 以 把 循环 中 的 所 有 重复 执行 车 换 为 循环 外 的 单 次 计算 ， 从 而 优 
化 程序 。 我 们 把 计算 的 结果 赋予 一 个 临时 变量 ,比如 说 i， 然后 把 循环 中 的 表达 式 蔡 换 为 :。 当 进 
行 与 此 类 似 的 “代码 移动 ”优化 时 ， 我 们 还 需要 考虑 另 一 个 问题 。 我 们 不 应 该 执行 任何 在 未 优化 
时 不 执行 的 指令 。 比 如 ， 如 果 有 可 能 在 不 执行 这 个 循环 不 变 指令 时 就 离开 循环 ， 那么 我 们 就 不 应 
该 把 该 指令 移动 到 循环 之 外 。 这 样 做 有 两 个 原因 。 

1) 如 果 该 指令 会 引发 一 个 异常 ， 那么 执行 此 指令 可 能 会 抛 出 一 个 原 程序 中 本 来 不 会 发 生 的 
异常 。 

2) 如 果 循 环 提早 退出 ,“ 优 化 ”过 的 程序 需要 的 执行 时 间 比 原 程序 更 多 。 

为 了 保证 while 循环 中 的 循环 不 变 表达 式 可 以 被 优化 , 编译 器 通常 把 语句 

while c { 

S; 


$ 
表示 成 为 下 面 的 等 价 语句 
if crt 
repeat 
5; 
until not c; 


} 
通过 这 种 方法 , 各 个 循环 不 变 表达 式 可 以 直接 放置 在 repeat-unti 结构 之 前 。 

在 公共 子 表达 式 消除 中 ,一 个 元 余 的 表达 式 计算 被 直接 丢弃 。 循 环 不 变 表达 式 消除 和 公共 
子 表达 式 消除 不 同 , 它 要 求 把 循环 内 的 一 个 表达 式 移动 到 循环 之 外 。 因 此 ,这 个 优化 通常 叫做 
“循环 不 变 代码 移动 "。 循 环 不 变 代码 移动 可 能 需要 重复 进行 ,因为 一 旦 一 个 变量 被 确定 具有 循 
环 不 变 的 值 , 使 用 这 个 变量 的 某 些 表达 式 也 可 能 成 为 循环 不 变 的 。 

部 分 宛 余 表达 式 

一 个 部 分 元 余 表 达 式 的 例子 如 图 9-30e 所 示 。 基 本 块 By 中 的 表达 式 b+c 在 路 径 B B>B, 
ERA, 但 是 在 路 径 B>B; >B, 上 不 元 余 。 我 们 可 以 在 基本 块 By 上 放 一 个 计算 b+c 的 指令 , 从 
而 消除 前 一 条 路 径 上 的 完 余 。 所 有 b +c 的 计算 结果 都 被 写 进 临 时 变量 1， 并且 By 中 对 b +e 的 计算 
ele Bt. 因此 , 和 循环 不 变 代码 移动 一 样 ,部 分 宛 余 消 除 需 要 放置 一 些 新 的 表达 式 计算 指令 。 
9.5.2 ”可 能 消除 所 有 宛 余 吗 

可 能 消除 各 条 路 径 上 的 所 有 宛 余 计算 吗 ? 除非 我 们 能 够 通过 创建 新 的 基本 块 来 改变 流 图 ， 
否则 答案 是 “不 能 ”。 
在 图 9.31a 显示 的 例子 中 , 如 果 程 序 的 执行 路 径 是 B1 一 B，->B4s, 则 表达 式 b+ < 在 基 
本 块 B， 中 元 余地 计算 。 但 是 ,我 们 不 能 简单 地 把 5+c 的 计算 指令 移动 到 B ,因为 这 么 做 会 在 执 
行路 径 为 Bl 一 B3 一 Bs 时 多 计算 一 次 +c 

我 们 想 做 的 是 在 基本 块 B; 和 B, 之 间 的 边 上 插入 b+c 的 计算 指令 。 为 了 插入 这 个 指令 , 我 
们 可 以 创建 一 个 新 的 基本 块 , 比如 By, 把 该 指令 放 到 By 中 , 并 使 得 从 By 开始 的 控制 流 首先 经 过 
Be 再 到 达 B4。 这 个 转换 显示 在 图 9-31b 中 。 口 

我 们 把 所 有 从 一 个 具有 多 个 后 继 的 结 点 到 达 另 一 个 具有 多 个 前 驱 的 结 点 的 边 定义 为 流 图 的 
关键 边 (critical edge) 。 通 过 在 关键 边 上 引入 新 的 基本 块 , 我 们 总 是 可 以 找到 一 个 基本 块 作为 放 
置 表达 式 的 适当 位 置 。 比 如 在 图 9-31b 中 从 B, 到 B, 的 边 就 是 关键 边 , 因为 Bs 具有 两 个 后 继而 
B4 有 两 个 前 驱 。 
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图 9-31 B, >B, 是 一 条 关键 边 


仅 靠 增加 基本 块 可 能 不 足以 消除 所 有 的 宛 余 计算 。 如 例 9. 29 所 示 , 我 们 要 复制 代码 ,以 便 
把 找到 的 具有 宛 余 特 性 的 路 径 隔离 开 来 。 
在 图 9-32a 所 示 的 例子 中 , KAR b +e WA B B BB, 被 宛 余 地 计算 。 我 
们 可 能 愿意 从 这 条 路 径 的 基本 块 Be 中 删除 b+c TRHA, RER BBB, >B, 上 计 
算 这 个 表达 式 。 但 是 , 源 程序 中 没有 哪个 程序 点 或 边 唯一 地 对 应 于 第 二 条 路 径 。 为 了 创建 这 样 
一 个 程序 点 , 我 们 可 以 复制 一 对 基本 块 B 和 B, 其 中 的 一 对 经 过 Bs 到达, 而 另 一 对 经 过 B 到 
ik, 如 图 9-32b 所 示 。 基 本 块 B 中 的 表达 式 b +c 的 结果 存放 在 上 中 , 并 在 By 中 被 移动 到 变量 d 
Hho By 是 从 By 到达 的 Be 的 拷贝 。 口 





图 9-32 为 消除 元 余 所 做 的 代码 复制 


因为 路 径 数 目 和 程序 中 条 件 分 支 的 数目 之 间 具 有 指数 关系 , 所 以 消除 所 有 的 完 余 表达 式 可 
能 会 大 大 增加 优化 后 代码 的 大 小 。 因 此 我 们 对 所 讨论 的 元 余 消 除 技术 做 了 一 些 限制 , 即 只 允许 
引入 新 的 基本 块 , 但 是 不 允许 复制 控制 流 图 的 任何 部 分 。 
9.5.3 ”懒惰 代码 移动 问题 

我 们 期 望 使 用 部 分 元 余 消除 算法 进行 优化 而 得 到 的 程序 能 够 具有 下 列 性 质 : 

1) 所 有 不 复制 代码 就 可 以 消除 的 表达 式 宛 余 计 算 都 被 消除 掉 了 。 

2) 优化 后 的 程序 不 会 执行 原来 的 程序 中 不 执行 的 任何 计算 。 


ee ee 

3) 表达 式 的 计算 时 刻 应 该 尽量 靠 后 。 

最 后 一 个 性 质 是 很 重要 的 ， 因为 找到 的 宛 余 表 达 式 的 值 通常 会 在 被 使 用 之 前 一 直 存放 在 寄 
存 器 中 。 尽量 靠 后 地 计算 一 个 值 可 以 尽 可 能 地 降低 该 值 的 生命 周期 ， 即 从 该 值 被 定 值 的 时 刻 到 
它 最 后 被 使 用 的 时 刻 之 间 的 时 间 间 隔 。 缩短 生命 期 也 就 尽 可 能 降低 了 它 使 用 寄存 器 的 时 间 。 我 
们 把 以 尽 可 能 延迟 计算 为 目标 的 部 分 元 余 消 除 优化 称 为 懒惰 代码 移动 。 

为 了 形成 对 于 这 个 问题 的 直观 理解 ， 我 们 首先 讨论 如 何 推导 单条 路 径 上 的 某 个 表达 式 是 否 
具有 部 分 宛 余 性 。 为 方便 起 见 ， 我 们 在 下 面 的 讨论 中 假设 每 个 语句 都 是 由 它 自己 组 成 的 单 语 句 
基本 块 。 

完全 宛 余 

如 果 在 到 达 基 本 块 B 的 所 有 路 径 中 , 一 个 表达 式 e 已 经 被 求 过 值 且 。e 的 运算 分 量 在 其 后 没有 
被 重新 定 值 , MAB PH e 就 是 宛 余 的 。 SS 是 那些 使 得 基本 块 B 中 的 e 变 得 宛 余 , 并 且 包 含 表 
AR e 的 基本 块 的 集合 。 所 有 的 从 S 中 的 某 个 基本 块 离开 的 边 必 然 形成 一 个 割 集 (eut set) WR 
把 这 些 边 删除 , 那么 基本 块 B 必然 和 程序 的 人 口 点 分 离 。 而 且 ， 在 从 5 中 的 基本 块 到 B 的 路 径 
H, e 的 所 有 运算 分 量 都 没有 被 重新 定 值 。 

部 分 宛 余 

如 果 基 本 块 B 中 的 一 个 表达 式 e 只 是 部 分 元 余 ， 那么 懒惰 代码 移动 算法 将 在 该 流 图 中 放置 这 
个 表达 式 的 附加 拷贝 ,试图 使 得 B 中 的 e 成 为 完全 宛 余 的 。 如 果 该 尝试 成 功 ， 那么 经 过 优化 后 的 
流 图 也 会 有 一 个 基本 块 的 集合 S, 其 中 的 每 个 基本 块 都 包含 表达 式 ， 并 且 离 开 它 们 的 边 成 为 程 
序 入 口 和 8 的 割 集 。 和 完全 宛 余 的 情况 一 样 , e 的 所 有 运算 分 量 都 不 会 在 从 5 中 的 基本 块 到 8 的 
路 径 上 被 重新 定 值 。 

9.5.4 ”表达 式 的 预期 执行 

对 于 被 插入 的 表达 式 还 有 一 个 约束 , 即 保证 优化 后 的 程序 不 会 执行 额外 的 运算 。 一 个 表达 
式 的 各 个 拷贝 所 放置 的 程序 点 必须 预期 执行 (anticipated) 此 表达 式 。 如 果 从 程序 点 p 出 发 的 所 有 
路 径 最 终 都 会 计算 表达 式 5+c 的 值 , JFE b Alc 在 那 时 的 值 就 是 它们 在 点 p 上 的 值 ， 那么 我 们 说 
一 个 表达 式 b+c 在 程序 点 p 上 被 预期 执行 。 

现在 让 我 们 研究 一 下 在 一 个 无 环 路 径 BB. 7B, 中 消除 部 分 匈 余 时 应 该 做 些 什 么 。 假 
设 表达 式 e 仅仅 在 B, MB, HRE, 并且。 的 运算 分 量 没有 在 这 条 路 径 的 基本 块 中 被 重新 定 值 。 
假设 有 一 些 边 和 上 面 的 路 径 交 汇 , 也 有 一 些 边 从 这 条 路 径 离开 。 我 们 看 到 , e 在 基本 块 B; 的 入 口 
处 没有 被 预期 执行 当 且 仅 当 存 在 一 个 从 B;(i<j <n) 发 出 的 边 ， 它 通 向 一 条 不 使 用 ee 的 值 的 执行 
路 径 。 因 此 , 对 执行 的 预期 限制 了 一 个 表达 式 最 前 可 以 被 插入 到 哪里 。 

我 们 就 可 以 创建 一 个 包含 了 边 8,_1 一 B; 的 满足 下 面条 件 的 制 集 。 如 果 e 在 B; 的 入口 处 可 用 
或 者 被 预期 执行 , 这 个 市 集 就 使 得 e ZEB, PR. WME e 在 B; 的 入 口 处 被 预期 执行 却 不 可 用 ， 
我 们 必须 在 这 条 进入 B; 的 边 上 放 一 个 e 的 拷贝 。 

我 们 可 以 选择 放置 表达 式 拷贝 的 位 置 ， 因 为 流 图 中 通常 有 多 个 割 集 满 足 上 所 有 要 求 。 在 上 面 
的 讨论 中 ;表达 式 的 计算 在 进入 我 们 所 关心 的 路 径 的 边 上 引入 。 这 样 做 可 以 在 不 引入 宛 余 计算 
的 情况 下 使 得 表达 式 的 计算 尽量 靠近 对 表达 式 值 的 使 用 。 请 注意 ; 这些 被 引入 的 运算 本 身 可 能 
因为 程序 中 同一 个 表达 式 的 其 他 实例 而 体现 出 部 分 宛 余 性 。 这 种 部 分 宛 余 性 可 以 通过 进一步 上 
移 计 算 过 程 而 消除 。 





Oo WER, 对 表达 式 值 的 使 用 和 对 变量 值 的 使 用 不 同 , 它 实际 上 是 说 该 表达 式 出 现在 某 个 语句 的 右 部 。 一 一 译 者 注 
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总 结 一 下 ,对 表达 式 的 预期 执行 限制 了 一 个 表达 式 可 以 被 放置 得 有 多 靠 前 。 不 能 把 它 放置 
得 太 靠 前 , 以 至 于 放置 它 的 地 方 还 没有 预期 执行 它 。 一 个 表达 式 被 放置 得 越 靠 前 ， 能够 删除 的 元 
余 性 就 越 多 。 在 能 够 消除 同样 的 宛 余 性 的 各 个 解 中 , 最 后 一 个 计算 该 表达 式 的 位 置 可 以 使 存放 
该 表达 式 的 寄存 器 的 生命 周期 最 小 化 。 

9.5.5 ”懒惰 代码 移动 算法 

至 此 , 这 里 的 讨论 给 出 了 一 个 包含 四 个 步骤 的 算法 。 第 一 步 使 用 执行 预期 来 确定 表达 式 可 
以 被 放 在 哪里 ; 第 二 步 寻 找 最 前 的 能 够 在 不 复制 代码 且 不 引入 不 必要 计算 的 情况 下 消除 最 多 的 
元 余 运 算 的 割 集 。 这 个 步骤 把 表达 式 的 计算 放置 在 最 前 的 预期 执行 这 些 表 达 式 的 程序 点 上 。 第 
三 步 把 割 集 尽 量 向 后 推 , 直到 继续 后 推 会 改变 程序 语义 或 引入 新 的 元 余 为 止 。 最 后 的 第 四 步 很 
简单 , 它 删 除 那些 给 只 使 用 一 次 的 对 临时 变量 赋值 的 语句 ,达到 清洗 代码 的 目的 。 每 一 个 步骤 都 
伴随 一 个 数据 流 分 析 过 程 : 第 一 个 和 第 四 个 是 逆向 数据 流 问 题 , 而 第 二 个 和 第 三 个 是 前 向 的 数据 
流 问题 。 

算法 概览 

1) 使 用 一 个 逆向 数据 流 分 析 过 程 找到 各 个 程序 点 上 预期 执行 的 所 有 表达 式 。 

2); 第 二 步 把 对 表达 式 的 计算 放置 在 满足 下 面条 件 的 程序 点 上 。 对 于 每 个 这 样 的 点 ,总 存在 
菜 条 路 径 使 得 这 些 点 是 此 路 径 中 第 一 个 预期 执行 这 个 表达 式 的 点 。 我 们 在 一 个 表达 式 最 先 被 预 
期 执行 的 地 方 放置 了 该 表达 式 的 拷贝 之 后 , 假设 有 一 个 这 样 的 程序 点 p, 所 有 到 达 它 的 原 有 路 径 
中 该 表达 式 都 被 预期 执行 , 那么 现在 该 表达 式 在 程序 点 p 上 可 用 。 可 用 性 可 以 用 一 个 前 向 的 数据 
流 分 析 过 程 完 成 。 如 果 我 们 希望 把 这 个 表达 式 放置 在 尽量 靠 前 的 地 方 ， 我 们 只 要 找 出 满足 下 面 
条 件 的 程序 点 就 可 以 了 : 在 这 些 点 上 此 表达 式 被 预期 执行 但 是 不 可 用 。 

3) 在 一 个 表达 式 最 早 被 预期 执行 的 地 方 对 表达 式 求 值 可 能 会 使 得 表达 式 的 值 在 被 使 用 之 前 
很 久 就 被 生成 了 。 一 个 表达 式 可 被 后 延 到 某 个 程序 点 的 条 件 如 下 : 在 到 达 这 个 点 的 所 有 路 径 上 ， 
这 个 表达 式 在 这 个 程序 点 之 前 已 经 被 预期 执行 , 但 是 还 没有 使 用 这 个 值 。 可 后 延 表达 式 通 过 使 
用 一 个 前 向 的 数据 流 分 析 过 程 找到 。 我 们 把 表达 式 放置 在 不 能 再 后 延 的 程序 点 上 。 

4) 使 用 一 个 简单 的 逆向 数据 流 分 析 过 程 来 删除 那些 给 程序 中 只 使 用 一 次 的 临时 变量 赋值 的 
语句 。 

预 处 理 步 又 

我 们 现在 给 出 完整 的 懒惰 代码 移动 算法 。 为 了 使 算法 简单 一 些 , 我 们 假设 开始 时 每 个 语句 
自己 组 成 一 个 基本 块 , 而 且 我 们 只 在 基本 块 的 开头 引入 新 的 表达 式 计算 指令 。 为 了 保证 这 个 简 
化 不 会 降低 这 个 技术 的 有 效 性 , 如 果 一 个 边 的 目标 结 点 有 多 个 前 驱 , 我 们 就 在 这 个 边 的 源 结 点 和 
目标 结 点 之 间 插 人 一 个 新 的 基本 块 。 这 人 么 做 显然 也 考虑 了 对 程序 中 所 有 的 关键 边 。 

我 们 把 每 个 基本 块 B 的 语义 抽象 为 两 个 集合 : e_uses 表示 B 中 计算 的 表达 式 , 而 e_killp 表示 
被 8 杀 死 的 表达 式 , 即 某 个 运算 分 量 在 B 中 定 值 的 表达 式 的 集合 。 在 对 懒惰 代码 移动 技术 中 的 
四 个 数据 流 分 析 模 式 进行 讨论 时 , 将 会 一 直 使 用 例 9. 30。 这 四 个 数据 流 分 析 模 式 在 图 9-34 中 进 
行 了 简单 的 定义 。 

UER 在 图 9-33a 的 流 图 中 , KER b+c 出 现 三 次 。 因 为 基本 块 Be 是 一 个 循环 的 一 部 分 ， 
块 中 的 表达 式 b+c 可 能 被 执行 很 多 次 。 在 By 中 对 此 表达 式 的 计算 不 仅 是 循环 不 变 的 , 它 还 是 一 
个 元 余 表 达 式 ,因为 表达 式 的 值 已 经 在 基本 块 B 中 使 用 。 对 于 这 个 例子 来 说 , 我 们 只 需要 计算 
b +c 两 次 : 一 次 在 基本 块 Bs 中 计算 , 而 另 一 次 在 B, 之 后 到 B, 之 前 的 路 径 上 计算 。 本 节 讨 论 的 
懒惰 代码 移动 算法 将 把 表达 式 计算 放置 在 基本 块 B4 和 Bs 的 开头 。 口 


414 RIF 








最 早 的 











图 9-33 fil 9.30 的 流 图 


预期 执行 的 ( anticipated) 表达 式 

回顾 一 下 预期 执行 的 定义 。 如 果 从 程序 点 bp 出 发 的 所 有 路 径 最 终 都 会 计算 表达 式 !+ 的 值 ， 
并 生计 算 时 5 和 < 的 值 就 是 它们 在 点 p 上 的 值 , 那么 我 们 说 表达 式 b +c 在 程序 点 p 上 被 预期 
执行 。 

在 图 9-33a 中 , 所 有 在 其 入口 处 预期 执行 表达 式 b+c 的 基本 块 都 用 浅 灰 色 方块 表示 。 表 达 
st b +c ERASE B3, By, Bs, Bo. By 和 Be 中 被 预期 执行 。 它 在 B2 的 人 口 处 没有 被 预期 执行 ， 
这 是 因为 。 的 值 在 该 基本 块 内 被 重新 计算 , 因此 假如 在 B, 的 开始 处 计算 b+c 的 值 , 这 个 计算 结 
果 不 会 在 任何 路 径 上 被 使 用 。 在 有 的 人口 处 也 没有 预期 执行 b+c, 因为 在 从 By 到 B, 的 分 支 上 
这 个 计算 是 不 必要 的 (虽然 在 路 径 B 一 B5; 一 B6 上 使 用 了 这 个 计算 ) 。 类 似 地 , 因为 有 Bs 到 B11 的 
分 支 , 该 表达 式 也 没有 在 Bs 的 开头 被 预期 执行 。 一 条 路 径 上 的 各 个 结 点 是 否 预期 执行 一 个 表达 
式 可 能 会 不 断交 替 变 化 , 如 路 径 B7 一 Bs 一 Be 所 示 。 

预期 执行 表达 式 问 题 的 数据 流 方程 组 如 图 9-34b 所 示 。 问 题 的 分 析 过 程 是 逆向 的 。 RAS 
一 个 表达 式 在 基本 块 B 的 出 口 处 被 预期 执行 , BEDE ekile 集合 中 ， 那么 它 在 基本 块 的 入 口 
处 也 被 预期 执行 。 基 本 块 B 同时 也 生成 一 个 表达 式 集合 e_usep, 表示 基本 块 B 新 使 用 了 其 中 的 表 
达 式 。 在 一 个 程序 的 出 口 处 没有 表达 式 被 预期 执行 。 我 们 关心 的 是 在 所 有 后 继 路 径 中 都 被 预期 
执行 的 表达 式 , 因此 交汇 运算 是 交集 运算 。 因 此 ， 和 我 们 在 9.2.6 节 中 讨论 可 用 表达 式 时 类 似 ， 
内 部 程序 点 的 初始 值 是 表达 式 的 全 集 U。 

可 用 (avaiable) 表达 式 

第 二 步 之 后 ， 一 个 表达 式 的 多 个 拷贝 会 被 分 别 放置 到 该 表达 式 首次 被 预期 执行 的 程序 点 上 。 


机 器 无 关 优 化 415 





这 么 做 之 后 , 如 果 原 来 的 程序 中 所 有 到 达 程 序 点 bp 的 路 径 都 预期 执行 这 个 表达 式 , 那么 现在 这 个 
表达 式 就 在 点 p 上 可 用 。 这 个 问题 和 9.2.6 节 中 描述 的 可 用 表达 式 问题 类 似 。 但 是 这 里 使 用 的 
传递 函数 略 有 不 同 。 一 个 表达 式 在 一 个 基本 块 的 出 口 处 可 用 的 条 件 有 两 个 : 
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图 9-34 ”部 分 元 余 消 除 中 的 四 个 数据 流 分 析 过 程 


1) FARES R 

D 在 和 人口 处 可 用 。 

© 在 基本 块 的 人 口 处 所 预期 执行 的 表达 式 集合 中 ( 即 如 果 我 
们 选择 在 人 口 处 计算 这 个 表达 式 , 它 就 会 在 人 口 处 变 得 可 用 )。 

2) 没有 被 这 个 基本 块 杀 死 。 

用 于 可 用 表达 式 的 数据 流 方程 组 如 图 9-34b 所 示 。 为 了 避免 
混淆 IN 的 含义 , 我 们 在 数据 流 分 析 问 题 的 名 字 后 加 上 “LB]. in”, 
以 这 个 方式 来 表示 某 次 分 析 所 得 到 的 结果 。 

依据 最 前 放置 的 策略 而 在 一 个 基本 块 B 上 放置 的 表达 式 的 集 
合 ( 即 earliest [ B]) 被 定义 为 被 预期 执行 但 不 可 用 的 表达 式 集 


合 ， 即 








earliest[ B | = anticipated| B]. in ~ available[ B]. in. 9-35 例 9 31 的 流 图 用 
图 9-35 的 流 图 中 表达 式 b+c 在 基本 块 B3 的 和 人口 点 没 ”以 说 明 可 用 表达 式 的 使 用 
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有 被 预 期 执行 , 但 是 在 基本 块 B 的 入 口 处 被 预期 执行 。 然 而 , 没有 必要 在 基本 块 By 中 计算 表达 
stb +c, 因为 By 使 得 表达 式 5+c 在 此 处 变 得 可 用 。 E 
EA 图 9.33a 中 带 有 黑色 阴影 的 各 个 基本 块 上 的 表达 式 b+ 不 可 用 ， 这 些 基 本 抉 是 By 
B,, B, 和 B50 该 表达 式 的 靠 前 放置 的 位 置 使 用 带 有 黑色 阴影 的 灰色 方块 表示 ,它们 是 Bs 和 Bso 
请 注意 , b +c 被 认为 在 B4 的 入 口 处 可 用 , 因为 在 一 条 路 径 B1 +B, BB, 中 ,b+ 至 少 被 预期 
执行 一 次 一 一 在 这 个 例子 里 是 B3 一 一 并 且 从 B 的 入 口 点 开始 , bA c 都 没有 被 重新 计算 。 O 











2x2 方块 的 补 全 1 

被 预期 执行 的 表达 式 (其 他 文献 中 也 称 之 为 “很 忙 的 表达 式 ”) 是 一 类 我 们 之 前 没有 看 到 

的 数据 流 分 析 。 虽 然 我 们 已 经 看 到 了 活跃 变量 分 析 ( 见 9.2.5 节 ) 这 样 的 逆向 框架 , 且 我 们 看 
到 了 可 用 表达 式 分 析 (9. 2. 6 节 ) 那 样 使 用 交集 运算 作为 交汇 运算 的 框架 。 这 是 第 一 个 具有 这 
两 个 特点 的 有 用 分 析 技 术 的 例子 5 几乎 我 们 使 用 的 所 有 分 析 技 术 都 可 以 放 到 四 个 分 组 中 的 某 
一 个 中 。 这 四 个 组 按照 下 面 的 方法 进行 刻 划 : 它们 是 前 向 的 还 是 北向 的 , 它们 是 使 用 并 集运 
算 还 是 交集 运算 作为 交汇 运算 (可 以 按照 这 两 个 特性 的 不 同 取 值 把 各 个 数据 流 分 析 模式 分 别 
放 到 一 个 2 x2 方 块 中 的 某 个 空格 中 ,而 本 节 的 分 析 技术 填补 了 方 阵 中 的 一 个 空格 , 译 者 注 )。 
同时 请 注意 ,使 用 并 集 的 分 析 总 是 涉及 是 否 存在 一 条 路 径 使 得 某 件 事情 为 真 ,而 使 用 交集 的 分 


| 析 考 虑 的 是 某 些 事情 是 否 对 于 所 有 的 路 径 都 为 真 。 











可 后 延 ( postponable) 表达 式 

算法 的 第 三 步 在 保持 原 程序 语义 并 将 完 余 最 小 化 的 情况 下 把 表达 式 的 计算 尽量 地 延 后 。 例 
9. 33 说 明了 这 个 步骤 的 重要 性 。 
在 图 9-36 所 示 的 流 图 中 , RAR b +c 在 路 径 BI 
一 Bs 一 Be 一 Bz 中 被 计算 两 次 。 表 达 式 b+c 甚至 在 基本 块 B 
的 开头 就 被 预期 执行 了 。 如 果 我 们 在 表达 式 被 预期 执行 的 时 
候 立 刻 计算 它 的 值 , 那么 我 们 就 要 在 B 中 计算 b+c 的 值 。 
计算 结果 将 在 一 开始 就 被 保存 起 来 , 经 过 由 基本 块 B,、Bs 组 
成 的 循环 的 执行 , 最 后 由 基本 块 B, 使 用 。 在 另 一 种 方法 中 ， 
我 们 可 以 把 表达 式 b + e 的 计算 推迟 到 By 的 开始 以 及 控制 流 
即将 从 By ANA By 的 时 候 。 口 

正式 地 讲 , 一 个 表达 式 x +y 可 后 延 到 程序 点 了 的 前 提 如 
F: 在 所 有 从 程序 入 口 结 点 到 达 p 的 路 径 中 都 会 碰 到 一 个 位 19-36 例 9.33 的 流 图 , 用 
置 较 前 的 x+y, 并 且 在 最 后 一 个 这 样 的 位 置 到 之 间 没 有 对 以 说 明 后 延 一 个 表达 式 的 需求 
x+y 的 使 用 。 
让 我 们 再 次 考虑 图 9-33 中 的 表达 式 b+c。 其 中 可 放置 b+c 的 两 个 最 前 的 点 是 B 和 
Bs. WES, 这 两 个 基本 块 在 图 9-33a 中 都 被 表示 为 带 有 黑色 阴影 的 灰色 方块 ,这 表示 在 且 只 在 
这 两 个 基本 块 上 5 +6 被 预期 执行 但 不 可 用 。 我 们 不 能 把 6+c 从 Bs 后 延 到 Be, 因为 b+c 在 Bs 
中 被 使 用 了 。 但 是 我 们 可 以 把 它 从 Bs 后 延 到 B4。 

但 是 , 我 们 不 能 把 b+c 从 B, 后 延 到 B 。 原因 是 虽然 5+c EB, 中 没有 使 用 , 把 它 放 到 B, 
中 而 不 是 B, 中 会 引起 路 径 B; 一 Be 一 B; 上 的 宛 余 计算 。 我 们 将 看 到 , B4 是 我 们 能 够 计算 b+c 的 
最 后 位 置 之 一 。 E 
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可 后 延 表达 式 问 题 的 数据 流 方程 组 如 图 9-34c 所 示 。 这 个 分 析 过 程 是 前 向 的 。 我 们 不 能 把 一 
个 表达 式 “ 后 延 ” 到 程序 的 人 口 处 , 因此 OUT[ ENTRY] = 0 如 果 一 个 表达 式 在 中 中 没有 使 用 ， 
且 它 可 以 后 延 到 B 的 入 口 处 ; 或 者 它 在 earliest B] P, 那么 它 就 可 以 被 后 延 到 B 的 出 口 处 。 除 非 
一 个 基本 块 的 所 有 前 驱 结 点 出 口 处 的 可 后 延 集合 中 都 包含 某 个 表达 式 , 否则 该 表达 式 不 能 被 后 
延 到 这 个 基本 块 的 入 口 处 。 因 此 , 这 个 数据 流 分 析 的 交汇 运算 是 交集 运算 , 并 目 各 个 内 部 程序 点 
必须 被 初始 化 为 相应 半 格 的 顶 元 素 一 一 全 集 。 

粗略 地 说 , 一 个 表达 式 将 被 放置 在 边界 上 ，, 即 一 个 表达 式 从 可 后 延 转变 成 为 不 可 后 延 的 地 
方 。 更 加 明确 地 说 , 表达 式 e 可 以 被 放置 在 基本 块 B 的 开始 处 的 前 提 条 件 是 该 表达 式 在 8B 人口 处 
的 earliest 集合 或 可 后 延 集合 中 。 男 外 ， 当 下 列 条 件 之 一 成 立时 , Be 的 后 延边 界 中 : 

1) e 不 在 集合 postponable[ B]. out Po HAW, e 在 e_usep Po 

2) e 不 能 被 后 延 到 B 的 某 个 后 继 基 本 块 。 换 句 话 说, 存在 一 个 B 的 后 继 基本 块 使 得 e 不 在 该 
后 继 人 口 处 的 earliest 集合 和 可 后 延 集合 中 。 

因为 在 算法 的 预 处 理 阶 段 引 入 了 新 的 基本 块 , 所 以 在 上 述 两 种 情形 中 , RER e 可 以 放 在 基 
本 块 召 的 前 面 。 
图 9-33b 显示 了 上 述 分 析 的 结果 。 其 中 的 灰色 方块 表示 了 相应 earliest 集合 中 包含 b+c 
的 基本 块 , 而 黑色 阴影 的 方块 表示 了 相应 可 后 延 集合 中 包含 5+c 的 基本 块 。 因 此 , RAR b +c 
的 最 后 放置 位 置 在 基本 块 Bh 和 Bs 的 入 口 处 , 这 是 因为 

1) b+c Æ B, 的 可 后 延 集合 中 , 但 是 不 在 B, 的 可 后 延 集中 , 并 且 

2) B; 的 earliest RABAT b+c, 并 且 它 使 用 了 6 +c。 

如 图 所 示 , 该 表达 式 的 值 在 基本 块 Bt 和 Bs 中 被 存放 到 临时 变量 上 中 , 在 任何 其 他 地 方 的 
b +e 都 被 替换 为 t。 口 

被 使 用 的 (Used) 表达 式 

最 后 , 用 一 个 逆向 分 析 过 程 来 确定 一 个 被 引入 的 临时 变量 是 否 在 它 所 在 基本 块 之 外 的 其 他 
地 方 使 用 。 如果 从 程序 点 p 出 发 的 一 条 路 径 在 表达 式 被 重新 求 值 之 前 使 用 了 该 表达 式 , 那么 我 们 
说 该 表达 式 在 点 p 上 被 使 用 。 这 个 分 析 实 质 上 是 活跃 性 分 析 ( 是 对 表达 式 而 言 , 而 不 是 对 变量 而 
Bde 

被 使 用 的 表达 式 问 题 的 数据 流 方程 组 如 图 9-34d 所 示 ， 这 个 分 析 过 程 是 逆向 的 。 如 果 一 个 
在 基本 块 B 的 出 口 点 被 使 用 的 表达 式 不 在 B 的 最 后 放置 (latest ) 集合 中 , 那么 它 也 是 一 个 在 B 的 
入 日 点 处 被 使 用 的 表达 式 。 一 个 基本 块 生成 了 e_usep 集合 中 的 全 部 表达 式 , 就 是 说 新 近 使 用 了 
这 些 表 达 式 。 在 程序 的 出 口 处 没有 表达 式 被 使 用 。 因 为 我 们 关心 的 是 找 出 被 任何 后 续 路 径 所 使 
用 的 表达 式 , 因此 这 个 问题 的 交汇 运算 是 并 集运 算 。 因 此 , 各 个 内 部 点 必须 被 初始 化 为 相应 的 半 
格 的 项 元 素 一 一 空 集 。 

综合 全 部 步骤 

本 算法 的 各 个 步骤 在 算法 9. 36 中 进行 了 汇总 。 


懒惰 代码 移动 。 
输入 : 一 个 流 图 , 其 中 每 个 基本 抉 8 的 e_usep All e_hilly 已 经 计算 得 到 了 。 
输出 : 一 个 经 过 修改 且 满 足 9. 5. 3 节 所 描述 的 懒惰 代码 移动 的 四 个 条 件 的 数据 流 图 。 
方法 : 
1) 在 每 条 进入 某 个 具有 多 个 前 驱 的 基本 块 的 边 上 插入 一 个 空 基本 块 。 
2) 按照 9-34a 中 的 定义 , 计算 出 所 有 基本 块 BAY anticipated[ B]. in 的 值 。 
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3) 按照 9-34b 中 的 定义 ; 计算 出 所 有 基本 块 B 的 available[ B]. in 的 值 。 
4) 为 每 个 基本 块 B 计算 它 的 最 早 放置 位 置 ; 
earliest[ B] = anticipated{ B |. in - available{ B]. in 
5) 按照 图 9-340 的 定义 , 计算 出 所 有 基本 块 B 的 postponable[ B]. in 的 值 。 
6) 计算 所 有 基本 块 B 的 最 后 放置 集合 : 
latest[ B ] = (earliest| B | Upostponable[ B]. in) A 
(e_useg N= CM. 中 (earliest[ S ] Upostponable[ S]. in) ) ) 

请 注意 , 其 中 的 -表示 的 是 以 程序 中 所 计算 的 全 部 表达 式 的 集合 作为 全 集 的 补 集运 算 。 

7) 按照 图 9-34d 中 的 定义 , 找到 所 有 基本 块 H used[ B]. out 值 。 

8) 对 于 程序 计算 的 每 个 表达 式 , 比如 x+y, 做 下 列 处 理 : 

D H ax +y 创建 一 个 新 的 临时 变量 ;比如 说 加 

@ 对 于 所 有 基本 块 B, WR x + y FE latest[ B] Qused[ B). out 中, WYE t =x +y WAR B H 
IK 

@ 对 于 所 有 基本 块 B, 如 果 % +y ERA e_usegN (a latest| B] U used. out[B]) 中 , 就 用 i 来 
PRIN ET x ya O 

总 结 

部 分 元 余 消 除 技术 用 统一 的 算法 归纳 出 不 同类 型 的 元 余 计 算 。 这 个 算法 说 明了 如 何 使 用 多 
个 数据 流 问 题 来 寻找 最 优 的 表达 式 位 置 。 

1) 有 关 位 置 的 约束 由 预期 执行 表达 式 分 析 提 供 。 预期 执行 表达 式 分 析 是 一 个 逆向 的 数据 流 
分 析 , 并 使 用 交集 运算 作为 交汇 和 运算。 因为 它 确 定 的 是 对 于 各 个 程序 点 ， 一 个 表达 式 是 否 在 该 点 
之 后 的 所 有 路 径 中 被 使 用 。 

2) 一 个 表达 式 的 最 前 放置 位 置 就 是 该 表达 式 在 其 上 被 预期 执行 但 又 不 可 用 的 程序 点 。 可 用 
表达 式 是 通过 一 个 前 向 数据 流 分 析 找 到 的 , 它 使 用 交集 运算 作为 交汇 运算 。 对 各 个 程序 点 ; 这 个 
数据 流 分 析 技 术 计 算 了 一 个 表达 式 是 否 在 所 有 路 径 中 都 在 该 点 之 前 被 预 
期 执行 。 

3) 一 个 表达 式 的 最 后 放置 位 置 就 是 该 表达 式 在 其 上 不 可 再 后 延 的 程 
序 点 。 如 果 到 达 一 个 程序 点 的 所 有 路 径 都 没有 碰 到 某 个 表达 式 ;， 那么 该 
表达 式 在 此 程序 点 上 可 以 后 延 。 可 后 延 表达 式 是 通过 一 个 前 向 的 数据 流 
分 析 技 术 找 到 的 ， 这 个 分 析 技 术 使 用 交集 运算 作为 交汇 运算 。 

4) 除非 一 个 临时 赋值 语句 被 其 后 的 某 条 路 径 使 用 , 否则 该 赋值 语句 
可 以 被 消除 。 我 们 通过 一 个 逆向 的 数据 流 分 析 来 发 现 被 使 用 的 表达 式 ， 
它 使 用 并 集运 算 作为 交汇 运算 。 

9.5.6 9.5 节 的 练习 
练习 9. 5. 1: 对 于 图 9-37 中 的 流 图 : 
1) 计算 各 个 基本 块 的 开头 和 结尾 的 预期 执行 的 (anticipated ) 表达 式 
入 

2) 计算 各 个 基本 块 的 开头 和 结尾 的 可 用 (available) 表 达 式 集合 。 

3) 计算 各 个 基本 块 的 earliest 集合 。 

4) 计算 各 个 基本 块 的 开头 和 结尾 的 可 后 延 (postponable ) 表达 式 集合 。 图 9-37 练习 

5) 计算 各 个 基本 块 的 开头 和 结尾 的 被 使 用 的 (wused) 表 达 式 集合 。 9.5.1 的 流 图 
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6) 计算 各 个 基本 块 的 latest 集合 。 
”7) 引入 临时 变量 与 指出 它 在 什么 地 方 被 计算 , 并 在 什么 地 方 被 使 用 。 

练习 9.5.2: 对 于 图 9-10 中 的 流 图 ( 见 9.1 节 的 练习 ) 重 复 练习 9.5.1。 你 可 以 只 分 析 表 达 式 
at+b,.c-aMb#d, 

1! 练习 9.5. 3: 在 本 节 中 讨论 的 概念 也 可 以 应 用 到 部 分 死亡 代码 的 消除 。 如 果 一 个 变量 的 
定 值 仅仅 对 于 部 分 路 径 活 路 , 但 对 于 其 他 路 径 是 死亡 的 , 那么 这 个 定 值 就 是 部 分 死亡 的 (partially 
dead ) 。 我 们 可 以 只 在 该 变量 活跃 的 路 径 上 执行 这 个 定 值 ,从 而 优化 这 个 程序 的 执行 效率 。 在 消 
除 部 分 元 余 时 ,表达 式 被 移动 到 原来 的 表达 式 之 前 ; 和 消除 部 分 元 余 相 反 ， 部 分 死亡 代码 消除 中 
新 的 定 值 被 放 在 原来 的 定 值 之 后 。 设 计 一 个 算法 来 删除 部 分 死亡 代码 , 使 得 表达 式 只 在 一 定 会 
被 使 用 时 才 进 行 求 值 。 


9.6 流 图 中 的 循环 


在 至 今 为 止 的 讨论 中 ; 循环 并 没有 被 区 别 对 待 , 对 它们 的 处 理 方式 和 其 他 类 型 的 控制 流 没有 
什么 不 同 。 但 是 ,循环 的 重要 性 在 于 程序 花费 大 部 分 时 间 来 执行 循环 , 改进 循环 效率 的 优化 有 很 
大 的 影响 。 因 此 , 识别 循环 并 有 针对 性 地 处 理 它们 是 很 重要 的 。 

循环 也 会 影响 程序 分 析 所 需 的 时 间 。 如 果 一 个 程序 不 包含 任何 循环 , 我 们 只 需要 对 程序 进 
行 一 趟 扫描 就 可 以 得 到 数据 流 问题 的 答案 。 比 如 ,一 个 前 向 数据 问题 只 需要 按照 拓扑 次 序 对 所 
有 的 结 点 进行 一 次 访问 就 可 以 解决 。 

在 这 一 节 中 , 我 们 将 介绍 下 列 概念 : 支配 结 点 、 深 度 优先 
AEF. BL, 图 的 深度 和 可 归 约 性 。 我 们 在 后 面 进 行 的 对 寻 
找 循环 及 迭代 式 数 据 流 分 析 的 收敛 速 度 的 讨论 中 需要 用 到 这 
些 概 念 。 

9.6.1 支配 结 点 

如 果 每 一 条 从 流 图 的 入 口 结 点 到 结 点 的 路 径 都 经 过 结 
Hid, 我 们 就 说 d 支配 (dominate)n, EX d dom n。 请 注意 ， 
在 这 个 定义 下 每 个 结 点 支配 它 自己 。 可 
EER 考虑 图 9-38 中 的 以 结 点 1 作为 人口 结 点 的 流 图 。 

入 口 结 点 支配 所 有 结 点 (这 个 结论 对 所 有 的 流 图 都 成 立 ) ， 结 feat ee 
点 2 只 能 支配 它 自 己 ， 因 为 控制 流 可 以 通过 以 13 开头 的 路 © 

径 到 达 所 有 其 他 结 点 , 所 以 结 点 3 支配 除 1 、2 之 外 的 所 有 结 

点 。 结 点 4 支配 除 1、2、3 之 外 的 所 有 其 他 结 点 , 因为 所 有 从 G) 

1 开始 的 路 径 的 开头 要 么 是 1- ”2 一 3 一 4, EAE 134, 4 








点 5 和 6 都 只 支配 它们 自身 ， 因 为 控制 流 可 以 选择 从 它们 中 A 

的 某 一 个 结 点 通过 ,从 而 绕 过 另 一 个 结 点 。 最 后 , 结 点 7 支 G) 6) @) 

配 结 点 7、8、9、10; 结 点 8 支配 结 点 8、9、 10;9 和 10 只 支配 

它们 自身 。 口 (8. 
一 种 有 用 的 表示 支配 结 点 信息 的 方法 是 用 所 谓 的 支配 结 gE 

点 树 (dominator tree) 来 表示 。 在 树 中 , 入口 结 点 就 是 根 结 点 ， wW 

并 且 每 个 结 点 只 支配 它 在 树 中 的 后 代 结 点 。 比 如 , 图 9-39 图 9-39 图 9-38 


显示 了 图 9-38 中 流 图 的 支配 结 点 树 。 中 流 图 的 支配 结 点 树 
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支配 结 点 的 一 个 性 质 决 定 了 一 定 存在 支配 结 点 树 : 每 个 结 点 nw 具 有 唯一 的 直接 支配 结 点 
(immediate dominator) mo 在 从 入 口 结 点 到 达 结 点 的 任何 路 径 中 , CE n 的 最 后 一 个 支配 结 点 。 
用 dom 关系 来 表示 , n 的 直接 支配 结 点 m 具 有 以 下 性 质 : WR dn H d dom n, IA d dom m, 

我 们 将 给 出 一 个 简单 的 算法 来 计算 流 图 中 各 个 结 点 n 的 所 有 支配 结 点 。 这 个 算法 基于 如 下 
原理 : 如 果 pi po s pi 是 n 的 所 有 前 驱 并 且 d*n, 那么 d dom n 当 且 仅 当 对 于 每 个 六 d dom 
pi 这 个 间 题 可 以 写成 一 个 前 向 数据 流 分 析 问 题 。 数 据 流 的 值 域 是 基本 块 的 集合 。 二 个 结 点 的 
支配 结 点 集合 ( 它 自己 除外 ) 是 它 的 所 有 前 驱 的 支配 结 点 的 交集 ; 因此 这 个 问题 的 交汇 运算 是 交 
集运 算 基本 块 刀 的 传递 函数 直接 把 8 自身 加 入 到 输入 结 点 集合 中 。 问 题 的 边界 条 件 是 ENTRY 
结 点 支配 它 自身 。 最 后 , 内 部 结 点 的 初始 值 是 全 集 ， 也 就 是 所 有 结 点 的 集合 。 


寻找 支配 结 点 。 
MA: 一 个 流 图 C, 6 的 结 点 集 是 N, 边 集 是 上 Sane 
,而 入 口 结 点 是 ENTRY, F 
输出 : 对 于 N 中 的 各 个 结 点 n, 给 出 D(n), 





























即 支配 的 所 有 结 点 的 集合 。 传递 函数 fa(z) = 7U1{B} 
E. 3 -40 AGE ay 边界 条 件 OUTI[ENTRY] = {ENTRY} 
方法 : 求 出 由 图 9-40 给 定 参 数 的 数据 流 问 题 aie > 一 一 








的 解 。 输 入 流 图 的 基本 块 就 是 结 点 。 对 于 N 中 的 | 


our[B] = Ja(NIB]) 
所 有 结 点 n, D(n) =0UTL nj]。 加 IN[B] = Npprea(s) OUTP] 
使 用 这 个 数据 流 算法 来 寻找 支配 结 点 很 高 效 。 ”| 初始 化 设置 OUT[B] =N 


我 们 将 在 9.6.7 节 看 到 ， 只 要 对 流 图 中 的 结 点 进 one 
行 几 次 访问 就 可 以 得 到 问题 的 解 。 SAO eT AER 

















关系 dom 的 性 质 

有 关 支 配 结 点 的 一 个 关键 性 质 是 如 果 我 们 从 入 口 结 点 沿 着 一 个 无 环 路 径 到 达 结 点 n, A 
么 nn 的 所 有 支配 结 点 都 出 现在 这 条 路 径 中 ,并 且 它 们 总 是 以 相同 顺序 出 现在 所 有 这 样 的 路 径 
中 。 为 了 说 明 原 因 ,假设 在 一 个 到 达 的 无 环 路 径 Pi 中 支配 结 点 a Ab 的 顺序 为 先 a 后 5, 而 
在 另 一 条 路 径 P hb Ea 之 前 。 那 么 我 们 可 以 沿 着 P, 到 达 a 然后 再 沿 着 Py 到 达 ”从 而 避 
FT bo AI, b 实际 上 不 支配 no 

通过 这 个 推理 过 程 , 我 们 可 以 证 明 dom 是 传递 的 :如 果 a dom b 3f H. b dom c, ABA a dom 
co ÆA dom 也 是 反对 称 的 :如 果 a Ab, BBA a dom b Fil b dom a 不 可 能 同时 成 立 。 而且, 如 果 a 
和 4b 是 nn 的 两 个 支配 结 点 ,那么 a dom bak b dom a 中 必然 有 一 个 成 立 。 最 后 可 以 推出 除了 入 
口 结 点 之 外 的 每 个 结 点 5 必然 有 一 个 唯一 的 直接 支配 结 点 , 即 在 从 入 口 结 点 到 的 任何 无 环 
路 径 中 出 现 的 离 n 最近 的 支配 结 点 。 











让 我 们 回顾 一 下 图 9-38 中 的 流 图 , 并 假设 图 9-23 中 第 (4) 到 (6) 行 的 for 循环 依照 数 

字 顺 序 访问 其 结 点 。 令 D(n) 为 OU7[m] 中 的 结 点 的 集合 ; 因为 1 是 入 口 结 点 ; 算法 的 第 一 行 首先 

把 |1| 赋 给 DC1) 。 结 点 2 的 前 驱 只 有 1, 因此 D(2) = 121 UD(1)。 这 样 D(2) 就 被 设置 为 |1, 21 。 

然后 考虑 结 点 3, 它 的 前 驱 是 1、2、4 和 8。 因为 所 有 内 部 结 点 的 值 都 被 初始 化 为 结 点 的 全 集 N， 
D(3) = {3} UC{1} 41, Sey 区 TOR A PAD TO td na 

其 余 的 计算 过 程 如 图 9. 和 所 示 。 因 为 在 图 9.23a 中 ; 第 (3) 到 (6) 行 的 外 层 循环 的 第 二 次 迭代 中 

这 些 值 不 再 改变 , 它们 就 是 这 个 支配 结 点 问题 的 最 终 答案 。 口 
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D(4) = {4} U (D(3) N-D(7)) = {4} U ({1,3} 2 {1,2,... ,10}) = {1,3,4} 
D(5) = {5} U D(4) = {5} U {1,3, 4} = {1,3,4,5} 
D(6) = {6} U D(A) = {6} u {1,3,4} = {1,3,4,6} 
D(7) = {7} U (D(5) N D(6) n D(10)) 
= {7} U ({1,3, 4,5} {1,3,4,6} N {1,2,... ,10}) = {1,3,4,7} 
D(8) = {8} U D(7) = {8} U {1,3, 4,7} = {1,3,4,7,8} 
D(9) = {9} U D(8) = {9} U {1,3,4, 7,8} = (1,3, 4, 7,8, 9} 
D(10) = {10} U D(8) = {10} U {1,3,4,7,8} = {1,3,4, 7,8, 10} 














图 9-41 Bil 9. 39 中 支配 结 点 计算 的 最 终结 果 


9.6.2 深度 优先 排序 
如 2.3.4 节 中 所 介绍 的 , 对 一 个 流 图 的 深度 优先 搜索 (depth-first search) 逐一 访问 图 的 所 有 结 
点 。 搜 索 过 程 从 人 口 结 点 开始 , 并 首先 访问 离 人 口 结 点 最 远 的 结 点 。 一 个 深度 优先 过 程 中 的 搜 
索 路 线形 成 了 一 个 深度 优先 生成 树 ( Depth-First Spanning Tree，DFST) 。2.3.4 节 介绍 过 ， ioe 
序 遍历 过 程 首 先 访问 一 个 结 点 ， 然 后 从 左 到 右 递 归 地 访问 该 结 点 的 子 结 点 。 另 外 , 一 个 后 序 遍 历 
过 程 首先 递归 地 从 左 到 右 访 问 一 个 结 点 的 子 结 点 ; 然后 访问 该 结 点 本 身 。 
还 有 一 种 排序 方式 对 于 流 图 分 析 很 重要 : 深度 优先 排序 ( depth-first ordering) 。 它 的 顺序 正好 
和 后 序 遍 历 的 顺序 相反 。 也 就 是 说 , 在 深度 优先 排序 中 , 我 们 首先 访问 一 个 结 点 , 然后 遍历 该 结 
点 的 最 右 子 结 点 ， 再 遍历 这 个 子 结 点 左边 的 子 结 点 ， 依 此 类 推 。 但 是 在 我 们 为 流 图 构造 生成 树 之 
前 , 我 们 可 以 选择 把 一 个 结 点 的 哪个 后 继 作为 它 在 树 中 的 最 右 子 结 点 , 再 选择 哪个 后 继 是 下 一 个 
Fai, 等 等 。 在 我 们 给 出 深度 优先 排序 的 算法 之 前 , 首先 考虑 一 个 例子 。 
UES 医 | 9-38 中 流 图 的 一 个 可 能 的 深度 优先 表示 法 如 图 9-42 所 示 。 实 线 边 形成 了 这 棵 树 ， 
虚线 边 是 流 图 中 其 他 的 边 。 这 棵 树 的 深度 优先 遍历 是 1-3-;4_,6-78_,10, 然后 回 到 8, 再 到 
9。 我 们 再 一 次 回 到 8, 再 回 到 7、6 和 4, 然后 前 进 到 5。 我 们 从 5 回 到 4, 然后 回 到 3 M1, RN 
从 1 前 进 到 2, 然后 从 2 回 到 1。 这 样 我 们 就 遍历 了 整 棵 树 。 
因此 , 这 次 遍历 的 前 序 序列 是 : 
1,354, Gu FH dO 9, Sy 2 
图 9-42 中 树 的 后 序 遍 历 顺序 是 : 
E bd nd ds 1 
深度 优先 排序 的 顺序 和 后 序 遍 历 序列 相反 ， 即 
EE e a 10 口 
现在 我 们 给 出 一 个 算法 来 寻找 一 个 流 图 的 深度 优先 生成 树 和 相应 的 深度 优先 排序 。 正 是 这 
个 算法 从 图 9-38 的 流 图 中 找到 了 图 9-42 中 的 DEST, 
深度 优先 生成 树 和 深度 优先 排序 。 
输入 : 一 个 流 图 6。 
输出 : G 的 一 个 DFST 树 7T 和 G 中 结 点 的 一 个 深度 优先 排序 。 
方法 : 我 们 使 用 图 9-43 的 递归 过 程 search(n)。 这 个 算法 首先 把 G 的 所 有 结 点 初始 化 为 
“unvisited” , 然后 调用 search( no) , 其 中 no 是 入 日 结 点 。 当 它 调用 search(n) 的 时 候 , 首先 把 n 标 
记 为 “visited”, 以 免 把 n 再 次 加 入 到 树 中 。 它 使 用 <。 作为 计数 器 , MC 的 结 点 总 数 一 直 倒 计 数 到 
Lo 在 算法 执行 的 时 候 把 c 的 值 赋 给 结 点 n 的 深度 优先 编号 df[n] 。 边 的 集合 了 形成 了 G 的 深度 
优先 生成 树 。 = 
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G~.. for (nw 的 各 个 后 继 s) 
K a if (s 标记 为 “unvisited”) { 
oe ---2) >, #5 ns IMABIT H; 
í X X search(s); 
N t } 
AT O \ dfnin] = c; 
ne ~ { A ec=c— E 
r ee } 
: Se ae / i main() { 
oD) x a T = 0;/* 边 集 */ 
pie Fi / for (G 的 各 个 结 点 n) 
i (8) x Li A fin tid “unvisited”; 
JX ap A yw c = G 的 结 点 个 数 ; 
(9) wee ; search(no); 
ed CE Gren AAR 


void search(n) { 
ynrin A “visited”; 








图 9-42 9-38 中 流 图 的 一 个 深度 优化 表示 图 9-43 深度 优先 搜索 算法 


于 对 于 图 9-42 中 的 流 图 , 算法 9. 41 把 < 设置 为 10; 并 调用 search(1) 开 始 搜索 。 其 余 的 
执行 序列 显示 在 图 9-44 中 。 | 口 





调用 search(1) 结 点 1 有 两 个 后 继 。 假 设 首先 考虑 s = 3 ， 
把 边 1 > 3 加 入 到 工 中 。 

调用 search(3) 把 边 3 一 4 加 入 到 了 中 。 

调用 search(4) 结 点 4 有 两 个 后 继 ，4 和 6 。 假 设 首先 考虑 8 二 6， 
把 边 4 一 6 加 入 到 工 中 。 

调用 search(6) 把 边 6 > 7 加 入 到 了 中 。 

调用 search(7) 结 点 7 有 两 个 后 继 结 点 4 和 8。 但 是 4 已 经 被 search(4) 
标记 为 “visited”， 因 此 当 8 = 4 时 不 做 任何 处 理 。 
对 于 s = 8， 把 边 了 一 8 加 入 到 下 中 。 

调用 search(8) 结 点 8 有 两 个 后 继 ，9 和 10 。 假 设 首先 考虑 s =10, 
把 边 8 一 10 加 入 到 五 中 。 

调用 search(10) 10 有 后 继 7 ， 但 是 7 已 经 被 标记 为 “visited”。 
因此 search(10) 设置 dfn[10] = 10, c= 9 并 结束 。 

回 到 search(8) 把 s 设置 为 9， 并 把 边 8 一 9 加 入 到 下 中 。 

调用 search(9) 9 的 唯一 后 继 1 已 经 被 设置 为 “visited ”, 
因此 设置 dfn[9] =9 ,c=9, 





回 到 search(8) 


回 到 search(7) 7 的 所 有 后 继 都 已 经 处 理 过 了 ,因此 设置 
dfn[7] =7 ,c= 6, 
回 到 search(6) 6 的 所 有 后 继 都 已 经 处 理 过 了 ,因此 设置 
dfnl6| =6 ,c= 5。 
回 到 search(4) 4 的 后 继 3 已 经 是 “visited ”， 但 是 5 还 没有 ， 
因此 把 边 4 > 5 加 入 到 树 中 。 
调用 search(5) 5 的 后 继 7 已 经 是 “visited ”， 因 此 设置 dfn[5] = 5 ， 


回 到 search(4) 


回 到 search(3) 


回 到 search(1) 2 尚未 被 处 理 ， 因 此 把 边 1 一 2 加 入 到 人 下 中 。 
调用 search(2) 设置 dn[l2] =2,c=1。 
回 到 search(1) 设置 dfn[1] =1,c=0。 


8 的 最 后 一 个 后 继 3 已 经 是 visited ”， 因 此 
不 处 理 s = 3 的 情况 。 到 此 为 止 , 8 的 所 有 后 继 
都 已 经 处 理 过 了 ， 因 此 设置 dfs] = 8 ,c 二 7。 


C= 45 


4 的 所 有 后 继 者 已 经 处 理 过 了 ， 因此 设置 dfn[ 引 二 4 ， 
人 3 
设置 dfn[3] =3,0=2. 





图 9-44 算法 9.41 在 图 9-42 的 流 图 上 执行 的 过 程 
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9.6.3 深度 优先 生成 树 中 的 边 

当 我 们 为 一 个 流 图 构造 DFST 时 , 流 图 的 边 可 以 被 分 为 三 大 类 : 

1) 前 进 边 (advancing edge)， 即 那些 从 一 个 结 点 m BGK m 在 树 中 的 一 个 真 后 代 结 点 的 边 。 
DFST 中 的 所 有 边 本 身 都 是 前 进 边 。 在 图 9-42 中 没有 其 他 的 前 进 边 。 但 是 , 假如 有 一 条 边 4 一 8， 
那么 这 条 边 就 是 前 进 边 。 

2) 有 些 边 从 一 个 结 点 m 到 达 m 在 树 中 的 某 个 祖先 (包括 m 自身 ), 我 们 将 把 这 些 边 称 为 后 
退 边 (retreating edge)。 比 如 , 图 9-42 Phy 43, 74, 83, 107 和 9-31 都 是 后 退 边 。 

3) TAH mn, 在 DFST 中 mw 和 w 都 不 是 对 方 的 祖先 。 边 2-33 和 5 一 7 是 图 9-42 中 这 
种 边 的 例子 。 我 们 把 这 种 边 称 为 交叉 边 (eross edge) 。 交 叉 边 的 一 个 重要 性 质 是 : 如 果 我 们 把 一 
个 结 点 的 子 结 点 按照 它们 被 加 入 到 树 中 的 顺序 从 左 到 右 排列 , 那么 所 有 的 交叉 边 都 是 从 右 到 
左 的 。 

应 该 注意 , mon 是 一 个 后 退 边 当 且 仅 当 dlm] dhnln]。 为 了 说 明 原因 , TERMI m 
JÈ n Æ DEST 中 的 一 个 后 代 , 那么 search(m) 在 search(n) 之 前 运行 结束 , 因此 dff m] =dfal n]. 
反 过 来 , WF dfn| m] Sdfn[n], ABABA search(m) Æ search(n) 之 前 结束 , 要 么 m=n。 但 是 如 
果 有 一 条 边 m>n, 那么 search(n) 必 须 在 search(m) 之 前 开始 , 否则 n 是 m 的 后 继 的 事实 将 使 得 m 
成 为 n 在 DFST 中 的 一 个 后 代 。 因 此 ,search(m) 运 行 的 时 间 是 search( i) 运行 时 间 中 的 一 个 区 间 ， 
由 此 我 们 可 以 知道 n 是 m 在 DEST 中 的 一 个 祖先 。 

9.6.4 回 边 和 可 归 约 性 

回 边 是 指 一 条 边 aod, CRA b 支配 了 它 的 尾 c。 对 于 任何 流 图 , 每 条 回 边 都 是 后 退 边 , 但 
并 不 是 所 有 的 后 退 边 都 是 回 边 。 如 果 一 个 流 图 的 任何 深度 优先 生成 树 中 所 有 后 退 边 都 是 回 边 ， 
那么 该 流 图 被 称 为 可 归 约 的 (reducible)。 换 句 话说 ,如果 一 个 流 图 是 可 归 约 的 , 那么 它 的 所 有 
DEST 的 后 退 边 的 集合 都 是 相同 的 , 并 且 就 是 流 图 的 回 边 集 合 。 但 如 果 流 图 是 不 可 轨 约 的 ( 即 不 
是 可 归 约 的 ), 那么 所 有 的 回 边 在 任何 DFST 中 都 是 后 退 边 , 但 是 每 个 DFST 中 都 可 能 男 有 一 些 后 
退 边 不 是 回 边 。 这 样 的 后 退 边 集合 在 不 同 的 DIST 中 有 所 不 同 。 因 此 , 如果 我 们 删除 流 图 中 所 有 
回 边 后 得 到 的 流 图 带 有 环 , 那么 该 图 就 是 不 可 归 约 的 。 反 过 来 也 成 立 。 








为 什么 回 边 是 后 退 边 
假设 ab 是 一 条 回 边 , 即 它 的 头 支配 它 的 尾 。 当 图 9-43 中 的 search 函数 到 达 a 时， 对 
search 的 调用 序列 必然 是 流 图 中 的 一 条 路 径 。 当 然 , 这 条 路 径 必然 包含 a 的 所 有 支配 结 点 。 
由 此 可 知 ， 当 search( a) Bei FART , 对 serach(b) 的 调用 必然 已 经 开始 但 尚未 结束 。 因 此 4a 
被 加 入 到 树 中 时 4b 已 经 在 树 中 , 并 且 a 是 作为 5 的 一 个 后 代 被 加 入 的 。 因 此 ab 必然 是 一 条 
后 退 边 。 











在 实践 中 出 现 的 流 图 几乎 都 是 可 归 约 的 。 如 果 只 使 用 诸如 if-then-else, while-do, continue 和 
break 语句 这 样 的 结构 化 控制 流 语句 , 那么 得 到 的 程序 的 流 图 总 是 可 归 约 的 。 即 使 使 用 了 goto 语 
句 , 程序 也 经 常 是 可 归 约 的 , 因为 程序 员 在 逻辑 上 会 使 用 循环 和 分 支 的 
方式 思考 问题 。 Pe. 

“0 (al, PS 
图 9-38 的 流 图 是 可 归 约 的 。 图 中 的 所 有 后 退 边 都 是 回 边 。 ee 
也 就 是 说 ,这 些 边 的 头 支配 各 自 边 的 尾 。 O As Rape 
考虑 图 9-45 中 的 流 图 , 它 的 初始 结 点 是 1。 结 点 1 支配 结 点 ， ， 流 图 的 规范 形式 
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2 和 3 但 是 2 不 支配 3, 3 也 不 支配 2。 因 此 , 这 个 流 图 没有 回 边 ; 因为 没有 哪 条 边 的 头 支配 其 必 
结 点 。 根 据 我 们 选择 从 search(1) 首 先 调用 search(2) 还 是 search(3) , 可 以 得 到 两 个 可 能 的 深度 优 
先生 成 树 。 在 第 一 种 情况 下 ; 32 是 一 个 后 退 边 但 不 是 回 边 ; 在 第 二 种 情况 下 , 293 是 一 个 
后 退 边 但 不 是 回 边 。 直 观 地 讲 ; 使 得 这 个 流 图 不 可 归 约 的 原因 是 环 2.3 可 以 由 两 个 不 同 的 地 方 进 
A: 结 点 2 和 结 点 3。 Oo 
9. 6. 5” 流 图 的 深度 、 

给 定 一 个 流 图 的 深度 优先 生成 树 ， 该 流 图 的 深度 (depth) 是 各 条 无 环 路 径 上 的 后 退 边 数目 中 
HRA, 我 们 可 以 证 明 这 个 深度 永远 不 会 大 于 直观 上 所 说 的 流 图 中 循环 锐 套 的 深度 。 如 果 一 
个 流 图 是 可 归 约 的 ， 那 和 我 们 可 以 用 * 回 边 "来 替换 上 面 的 “深度 "定义 中 的 “后 退 边 “， 因 为 任何 
DFST 中 的 后 退 边 集合 就 是 回 边 集合 。 深度 的 定义 因此 独立 于 实际 所 选 的 DFST， 我 们 确实 可 以 说 
“个 流 图 的 深度 ”, 而 不 是 流 图 的 特定 于 某 个 深度 优先 生成 树 的 深度 。 

图 9.42 中 流 图 的 深度 是 3, 因为 有 一 条 具有 三 条 后 退 边 的 路 径 

10 一 7 一 4 一 3 
但 是 没有 包含 四 个 或 更 多 后 退 边 的 无 环 路 径 。 这 里 的 最 “ 深 ” 的 路 径 恰巧 只 包含 了 后 退路 径 , 这 
AB—t+A. OR, 在 一 个 最 深 路 径 中 可 以 包含 后 退 边 、 前 进 边 和 交叉 边 。 u 
9.6.6 自然 循环 

在 一 个 源 程序 中 , 循环 可 以 有 很 多 种 描述 方法 : 它们 可 以 被 写成 for 循 环 、while 循环 或 repeat 
循环 ; 它们 甚至 还 可 以 用 标号 和 goto 语句 来 定义 。 从 程序 分 析 的 角度 来 看 , 循环 在 源 代码 中 以 什 
么 形式 出 现 并 不 重要 ， 重要 的 是 它们 是 否 具有 易于 被 优化 的 性 质 。 我 们 特别 关心 的 是 一 个 循环 
是 否 只 有 一 个 唯一 的 入 口 结 点 。 如 果 是 这 样 ， 编译 器 的 分 析 可 以 假设 某 些 初始 条 件 在 循环 的 每 
次 迭代 的 开头 成 立 。 这 种 优化 机 会 引发 了 定义 自然 循环 ”的 需求 。 

自然 循环 (natural loop) 通过 两 个 重要 的 性 质 来 定义 。 

1) 它 必须 具有 一 个 唯一 的 入 口 结 点 ， 称 为 循环 头 (header)。 这 个 入口 结 点 支配 了 循环 中 的 
所 有 结 点 , 否则 它 就 不 会 成 为 循环 的 唯一 人 口 。 

2) 必然 存在 一 条 进入 循环 头 的 回 边 ， 否则 控制 流 就 不 可 能 从 “循环 "中 直接 回 到 循环 头 , 也 
就 是 说 实际 上 并 没有 循环 。 

给 定 一 个 回 边 ned, 我 们 定义 该 边 的 自然 循环 ( natural loop of the edge) Æ d 加 上 那些 不 经 过 
d 就 能 够 到 达 的 结 点 的 集合 。 结 点 4 是 这 个 循环 的 循环 头 。 
构造 一 条 回 边 的 自然 循环 。 

输入 : 一 个 流 图 G 和 一 条 回 边 nd, 

输出 : 由 回 边 nd 的 自然 循环 中 的 所 有 结 点 组 成 的 集合 loop。 

Fisk: A loop 等 于 ln, d} 。 把 4 标记 为 “visited , 以 便 搜索 过 程 不 至 于 越过 结 点 d。 从 结 点 nn 
开始 对 输入 的 反 向 控制 流 图 进行 深度 优先 的 搜索 。 把 所 有 访问 到 的 结 点 都 加 入 loop。 这 个 过 程 
可 以 找到 所 有 不 经 过 d 就 可 以 到 达 的 结 点 。 口 
在 图 9.38 中 有 五 条 回 边 , 这 些 边 的 头 结 点 支配 了 它们 的 尾 结 点 。 它 们 是 : 10-7, 7-4, 
4—3, 8_33 和 9-31。 请 注意 , 这 些 边 恰好 就 是 所 有 的 被 认为 在 流 图 中 形成 循环 的 边 。 

回 边 10->7 有 自然 循环 |17, 8, 10}, 因为 8 和 10 是 不 经 过 7 就 能 到 达 10 的 结 点 。 回 边 7 一 
的 自然 循环 由 14, 5, 6, 7; 8, 10} 组 成 , 因此 包含 了 回 边 1097 的 循环 。 因 此 , 我 们 假设 后 者 是 
包含 在 前 者 中 的 一 个 内 部 循环 。 
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回 边 43 和 8 一 :3 的 自然 循环 具有 同样 的 头 ,， 即 结 点 3; 它们 恰巧 具有 同样 的 结 点 集合 : 13, 
4,5,6,7,8, 10} 。 因 此 , 我 们 将 把 这 两 个 循环 合并 成 为 一 个 。 这 个 循环 包含 了 前 面 找 到 的 两 个 


较 小 的 循环 。 
最 后 , 回 边 9 一 :1 的 自然 循环 是 整个 流 图 , 因此 是 最 外 层 的 循环 。 在 这 个 例子 中 , 四 个 循环 是 
Benen. Ai, 通常 会 有 两 个 互 不 包含 的 循环 。 回 


因为 一 个 可 归 约 的 流 图 中 的 所 有 后 退 边 都 是 回 边 , 我 们 可 以 把 每 条 后 退 边 和 一 个 自然 循环 
关联 起 来 。 这 个 结论 对 于 不 可 归 约 流 图 不 成 立 。 比 如 , 图 9-45 中 的 不 可 归 约 流 图 中 有 一 个 由 结 
点 2 和 3 组 成 的 环 。 环 中 的 边 都 不 是 回 边 , 因此 这 个 环 不 满足 自然 循环 的 定义 。 我 们 并 不 把 这 个 
环 当 作 自然 循环 , 因此 也 不 会 优化 它 。 这 种 情况 是 可 接受 的 , 因为 假设 所 有 循环 都 有 唯一 的 人 口 
点 可 以 使 循环 分 析 变 得 更 加 简单 。 而 且 不 管 怎么 说 , 不 可 归 约 的 程序 在 Rd 
实践 中 很 少见 到 。 
如 果 我 们 只 把 自然 循环 当 作 “循环 ”， 那么 可 以 得 到 下 面 的 有 用 性 
R, 即 除非 两 个 循环 具有 同样 的 循环 头 ,否则 它们 要 么 是 分 离 的 , BA 
一 个 嵌 套 在 另 一 个 中 。 这 样 我 们 就 很 自然 地 得 到 了 最 内 层 循环 (inner- E D 
most loop) 的 定义 ， 即 不 包含 其 他 循环 的 循环 。 
当 两 个 自然 循环 像 图 9-46 中 那样 具有 相同 的 循环 头 时 ,很 难说 谁 。 图 9-46 具有 相同 
是 内 层 的 循环 。 因 此 ， 如 果 两 个 自然 循环 具有 相同 的 循环 头 且 没有 哪 一 ，， 循 环 头 的 两 个 循环 
个 循环 真正 包含 在 另 一 个 循环 中 , 它们 将 被 合并 在 一 起 ， 当 作 一 个 循环 处 理 。 
DEJ 在 图 9-46 中 的 回 边 3 一 ! 和 4-1 的 自然 循环 分 别 是 11, 2, 3 和 11, 2, 4) 。 我 们 将 把 
它们 合并 成 一 个 循环 11, 2,3, 4}. 
然而 , 假如 图 9-46 中 有 另 一 个 回 边 2-1, 它 的 循环 是 |1, 21。 这 个 循环 将 是 第 三 个 以 1 为 
循环 头 的 自然 循环 。 这 个 循环 真 包含 于 循环 11, 2,3,4), 因此 它 不 会 和 其 他 两 个 自然 循环 合并 ， 
而 是 作为 包含 在 11, 2,3, 4| 中 的 内 层 循环 进行 处 理 。 口 
9.6.7 和 迭代 数据 流 算 法 的 收敛 速度 
我 们 现在 可 以 讨论 适 代 算法 的 收敛 速度 了 。 如 9.3. 3 节 中 所 讨论 的 ,算法 的 最 大 迄 代 次 数 可 
能 是 格 的 高 度 和 流 图 结 点 数 的 乘积 。 对 于 很 多 数据 流 分 析 而 言 , 我 们 可 以 对 求 值 过 程 进 行 适当 
排序 ,使 算法 经 过 很 少 的 迄 代 就 能 收敛 。 我 们 感 兴趣 的 性 质 是 是 否 所 有 影响 一 个 结 点 的 重要 事 
件 都 可 以 通过 一 个 无 环 的 路 径 到 达 该 点 。 在 至 今 已 经 讨论 过 的 数据 流 分 析 问 题 中 ,到 达 定 值 、 可 
用 表达 式 和 活跃 变 量 问题 具有 这 个 性 质 ， 而 常量 传递 则 不 具有 这 个 性 质 。 更 加 明确 地 说 ， 
。 如果 一 个 定 值 在 IN[ 8] 中 , 那么 必然 有 一 条 从 包含 4 的 基本 抉 到 达 B 的 无 环 路 径 使 得 
在 该 路 径 上 的 所 有 IN 和 OUT 值 中 。 
。 如 果 表达 式 x+y 在 基本 块 B 的 入口 处 不 可 用 , 那么 必然 有 一 条 具有 下 列 性 质 的 无 环 路 
径 : 要 么 该 路 径 从 程序 的 人 口 结 点 出发 并 且 不 包含 任何 杀 死 或 产生 +y 的 语句 ; BAB 
路 径 从 一 个 杀 死 了 x +y 的 基本 块 出 发 , 并 且 从 此 之 后 该 路 径 中 没有 产生 表达 式 x +y。 
。 如果 在 基本 块 B 的 出 口 处 活路 , 那么 必然 有 一 个 从 B 开始 到 达 对 的 某 次 使 用 的 无 环 
路 径 , 在 此 路 径 上 没有 对 4 的 定 值 。 
我 们 可 以 检验 出 在 上 述 各 个 情况 中 , 带 有 环 的 路 径 不 会 增加 任何 内 容 。 比 如 ,如 果 可 以 通过 
一 个 带 环 的 路 径 从 基本 块 B 的 结尾 到 达 * 的 使 用 点 , 那么 我 们 可 以 消除 这 个 环 , 得 到 一 个 更 短 的 
路 径 。 沿 着 这 个 较 短路 径 依然 可 以 从 B 到 达 x 的 这 个 使 用 点 。 
反 过 来 , 常量 传播 就 没有 这 个 性 质 。 考 虑 如 下 一 个 简单 程序 它 仅 包含 一 个 由 单个 基本 块 组 
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成 的 循环 , 基本 块 中 的 代码 为 
ory 
get 
goto L 


当 第 一 次 访问 这 个 基本 块 时 , 我们 发 现 。 具 有 常量 值 1, 但 是 " Mo RAE, BKA 
该 基本 块 时 ,我们 发 现 b 和 < 都 有 常量 值 1。 经 过 对 该 基本 块 的 三 次 访问 之 后 , 赋 给 < 的 常量 值 1 
才 到 达 a。 

如 果 所 有 有 用 的 信息 都 通过 无 环 路 径 传播 , 我 们 就 有 可 能 调整 迭代 数据 流 算法 中 访问 结 点 
的 顺序 ,以 便 经 过 儿 轮 结 点 访问 就 可 以 保证 这 些 信息 已 经 沿 着 所 有 的 无 环 路 径 传递 完毕 。 

回顾 一 下 9.6.3 节 中 说 过 , WME ab 是 一 条 边 , 那么 只 有 当 该 边 是 后 退 边 的 时 候 8 的 深度 优 
先 编号 才 会 小 于 a 的 编号 。 对 于 前 向 的 数据 流 问题 , 按照 深度 优先 顺序 来 访问 结 点 是 很 合适 的 。 
明确 地 说 , 我 们 对 图 9-230 中 的 算法 进行 修改 , 把 算法 中 访问 流 图 中 各 个 基本 块 的 第 (4) 行 代码 
替换 为 : 

for (按照 深度 优先 顺序 , 对 所 有 不 同 于 ENTRY 的 各 个 基本 块 B) | 
UJ 假设 一 个 定 值 4 在 如 下 路 径 上 传播， 
3-55 19-35 162345 41017 

其 中 的 整数 表示 该 路 径 上 的 各 个 基本 块 的 深度 优先 编号 。 那 么 , 图 9-23a 中 算法 的 第 (4) 到 (6) 
行 的 循环 第 一 次 运行 时 ，d 将 从 OUT[3] 传 播 到 IN[5] 再 传播 到 OUT[5], =, 最 后 到 达 OUT 
[35]。 因为 16 排 在 35 之 前 , d 不 会 在 这 一 轮 中 到 达 IN[16]。 在 4 被 放 进 OUT[35 ] 的 时 候 , 我 们 
已 经 计算 了 IN[16]。 但 是 下 次 我 们 运行 第 (4) 到 (6) 行 的 循环 时 ， 因为 此 时 d 已 经 在 OUT[35] 
中 , 它 将 在 计算 IN[16] 的 时 候 被 加 入 进去 。 定 值 d 同时 会 被 传播 到 OUT[16] , IN[23] , …, 最 后 
到 达 0UT[45]。 它 必须 在 这 里 等 待 下 一 轮 计算 , 因为 这 一 轮 中 已 经 计算 过 IN[4] 了 。 在 第 三 轮 
th, d 将 传播 到 IN[4], OUT[4], IN[10] 和 IN[17]。 因 此 在 三 轮 之 后 我 们 使 得 定 值 d 到达 了 基 
本 块 17。 口 

从 这 个 例子 中 不 难 抽取 出 一 般 规律 。 如 果 我 们 在 图 923a 中 使 用 深度 优先 排序 。 那 么 把 任何 
到 达 定 值 沿 着 一 条 无 环 路 径 传播 所 需要 的 和 迭代 轮 次 不 会 大 于 路 径 中 从 高 编号 基本 块 到 低 编号 基 
本 块 的 边 的 个 数 加 一 。 这 些 边 恰好 就 是 后 退 边 , 因此 ， 所 需 轮 次 就 是 流 图 的 深度 加 一 。 当 然 ， 算 
法 9.11 还 需要 再 做 一 次 不 改变 任何 值 的 迭代 , 才能 检测 出 所 有 定 值 都 已 经 被 传播 到 了 所 有 它 能 
够 到 达 的 地 方 。 因 此 , 使 用 了 深度 优先 基本 块 排序 的 这 个 算法 所 执行 的 迭代 轮 次 的 上 限 实际 上 
是 深度 加 二 。 一 项 研究 © 表明 ,常见 流 图 的 平均 深度 大 约 是 2.75。 因 此 这 个 算法 的 收敛 速度 
很 快 。 








: 产生 不 可 归 约 数据 流 图 的 一 个 原因 
在 一 种 情况 下 我 们 通常 不 能 指望 一 个 流 图 是 可 归 约 的 。 如 果 像 我 们 在 算法 9. 46 出 寻找 
自然 循环 所 做 的 那样 ,把 一 个 程序 的 流 图 的 边 反 疝 ， 那么 我 们 不 大 可 能 得 到 一 个 可 归 约 流 图 。 
直观 的 理由 是 , 虽然 典型 程序 的 循环 只 有 一 个 人 口 ,但 这 些 循 环 有 时 会 有 儿 个 出 口 。 当 我 们 
把 流 图 的 边 反 向 时 , 这 些 出 口 就 变 成 了 入 口 。 














© D.E. Knuth, “An empirical study of FORTRAN programs, ” Software; Practice and Experience 1; 2(1971) , pp- 105-133. 
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在 类 似 于 活跃 变量 这 样 的 逆向 数据 流 问 题 中 , 我 们 以 深度 优先 排序 的 逆序 来 访问 结 点 。 这 

样 , 我 们 可 以 沿 着 路 径 

35-19 3351623 454 10 17 
经 过 一 个 轮 次 把 基本 块 17 中 对 某 个 变量 的 一 次 使 用 逆向 传播 到 IN[4] 。 然 后 在 这 里 等 待 下 一 次 
迭代 ,以 便 把 它 传 播 到 0UT[45]。 在 第 二 轮 迭 代 中 , 它 到 达 IN[16], 在 第 三 轮 中 它 从 0UT[ 35] 
到 达 OUT[3]。 

总 的 来 说 , 深度 加 一 次 迭代 足以 把 一 个 变量 的 使 用 沿 着 任何 无 环 路 径 逆 向 传递 完毕 。 但 是 ， 
我 们 必须 在 每 次 迭代 中 按照 深度 优先 排序 的 逆序 来 访问 各 个 结 点 , 因为 这 样 才 能 在 一 次 迭代 中 
把 变量 的 使 用 沿 着 任意 长 的 下 降 结 点 序列 传递 。 

在 一 些 数据 流 分 析 问 题 中 , 环形 路 径 不 会 给 分 析 增 加 任何 信息 。 至 今 为 止 讨 论 的 界限 是 所 
有 此 类 问题 的 上 界 。 在 一 些 特殊 的 问题 中 ,比如 对 于 支配 结 点 问题 , 迭代 算法 的 收敛 速度 更 快 。 
在 输入 流 图 是 可 归 约 的 情况 下 , 如 果 以 深度 优先 顺序 访问 各 个 结 点 , 那么 数据 流 算法 的 第 一 轮 迭 
代 就 可 以 得 到 各 个 结 点 的 支配 结 点 集合 。 如 果 我 们 之 前 不 知道 输入 流 图 是 可 归 约 的 , 那么 我 们 
需要 一 次 额外 的 迭代 来 确定 算法 已 经 收敛 了 。 

9.6.8 9.6 节 的 练习 

练习 9.6.1; 对 于 图 9-10 中 的 流 图 ( 见 9:1 节 的 练习 ) : 

1) 计算 支配 关系 。 

2) 寻找 每 个 结 点 的 直接 支配 结 点 。 

3) 构造 支配 结 点 树 。 

4) 找 出 该 流 图 的 一 个 深度 优先 排序 。 

5) 根据 问题 4 的 答案 , 指明 其 中 的 前 进 、 后 退 和 交叉 边 以 及 树 的 边 。 

6) 这 个 流 图 是 可 归 约 的 吗 ? 

7) 计算 这 个 流 图 的 深度 。 

8) 找 出 这 个 流 图 的 自然 循环 。 

练习 9. 6.2: 对 于 下 列 流 图 重复 练习 9. 6. 1。 

1) 图 9-3。 

2 和 图 3829 

3) MAY 8.4.1 得 到 的 流 图 。 

4) 从 练习 8.4. 2 得 到 的 流 图 。 

| 练习 9. 6.3: 证 明 下 列 有 关 dom 关系 的 性 质 。 

1) Wn a dom b H. b dom c, 那么 a dom ce( 传 递 性 )。 

2) 如 果 a#b, 那么 a dom b Alb dom a 不 可 能 同时 成 立 ( 反 对 称 性 )。 

3) Moa Alb Æ n MATRA, 那么 a dom b Fil b dom a 之 一 必然 成 立 。 

4) RT ADEA, 每 个 结 点 n 都 有 一 个 唯一 的 直接 支配 结 点 一 一 在 任何 从 入 口 结 点 到 达 n 
的 无 环 路 径 中 , 这 个 支配 结 点 是 离 n 最 近 的 支配 结 点 。 

| 练习 9. 6.4: 图 9-42 是 图 9-38 中 流 图 的 一 个 深度 优先 表示 。 这 个 流 图 有 和 多少 个 其 他 的 深 
度 优先 表示 ? 请 记 住 , 不 同 的 子 结 点 顺序 表示 不 同 的 深度 优先 表示 。 

1! 练习 9. 6.5: 证 明 一 个 流 图 是 可 归 约 的 当 且 仅 当 我 们 删除 所 有 回 边 ( 即 头 结 点 支配 尾 结 
点 的 边 ) 后 得 到 的 流 图 是 无 环 的 。 

| 练习 9. 6. 6: 一 个 具有 个 结 点 的 完全 流 图 在 任意 两 个 结 点 2 和 j 之 间 ( 在 两 个 方向 上 ) 都 
有 边 ij. n 取 什 么 值 的 时 候 这 个 完全 流 图 是 可 归 约 的 ? 
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| 练习 9.6.7: 一 个 在 n 个 结 点 1,2,…， n 卡 的 无 环 完全 流 图 对 于 所 有 的 结 点 i 和 j(i <j) KR 
Blij HAR) BADR. 
1) n 取 什么 值 的 时 候 这 个 图 是 可 归 约 的 ? 
2) 如 果 给 所 有 的 结 点 i 都 加 上 自 循环 边 ii, 是 和 否 会 改变 对 问题 a HER? 
| 练习 9. 6.8: —A EH nh 的 自然 循环 被 定义 为 h 加 上 所 有 能 够 不 经 过 而 直接 到 达 


条 不 和 其 他 四 条 路 径 相交 的 路 径 到 达 的 结 点 。 
11 #3] 9.6.10: 说 明 每 个 不 可 归 约 流 图 的 每 个 深度 优先 表示 都 有 一 条 不 是 回 边 的 后 退 边 。 
11 练习 9. 6. 11: 说 明 如 果 条 件 
fla) Ag(a) Na < f(g(a)) á 
对 于 所 有 的 函数 fg 和 值 a 成 立 , 那么 通用 迭代 算法 ， 即 算法 9. 25, 在 按照 深度 优先 排序 执行 每 
次 欠 代 时 ， 经 过 深度 加 二 次 迁 代 之 后 必然 收敛 。 

| 练习 9. 6. 12: 找到 一 个 具有 两 棵 不 同 深度 的 DFST 的 不 可 归 约 流 图 。 

| 练习 9. 6. 13: 证 明 下 列 结论 : 

1) 如 果 一 个 定 值 d 在 IN[B] 中 ,那么 存在 某 条 从 包含 d 的 基本 块 到 达 8B 的 无 环 路 径 , 使 得 d 
在 该 路 径 上 的 所 有 IN 和 OUT 值 中 。 

2) 如 果 一 个 表达 式 x +y 在 基本 块 B 的 入口 处 不 可 用 ， 那么 必然 存在 某 条 到 达 2 的 无 环 路 径 
满足 下 面 的 条 件 : 要 么 该 路 径 从 程序 人 口 结 点 开始 并 且 不 包含 任何 杀 死 或 生成 +y 的 语句 ; 要 
入 该 路 径 从 一 个 杀 死 了 “+y 的 基本 块 开始 ， 并 且 路 径 中 不 包含 任何 生成 x+y 的 语句 。 

3) 如 果 * 在 基本 块 B 的 出 口 处 活路 ， 那么 必然 有 一 条 从 B 到 x 的 某 个 使 用 点 的 路 径 , 在 该 
路 径 上 没有 对 % 的 定 值 。 


9.7 ”基于 区 域 的 分 析 


至 今 为 止 我 们 讨论 的 迭代 数据 流 分 析 算 法 只 是 解决 数据 流 问题 的 方法 之 一 。 接 下 来 我 们 讨 
论 另 一 种 被 称 为 基于 区 域 的 分 析 (region-based analysis) 的 方法 。 回 顾 一 下 ， 在 迭代 分 析 方 法 中 ， 
我 们 为 各 个 基本 块 创建 传递 函数 ， 然后 通过 在 基本 块 上 进行 反复 扫描 来 寻找 不 动 点 解 。 一 个 基 
于 区 域 的 分 析 技术 并 不 仅仅 为 各 个 基本 块 创建 传递 函数 ， 它 为 越 来 越 大 的 程序 区 域 构造 用 以 描 
述 该 区 域 运 行情 况 的 传递 函数 。 最 终 构造 出 整个 过 程 的 传递 函数 ， 并 用 这 个 传递 函数 直接 得 到 
想 要 的 数据 流 值 。 

_ 个 使 用 适 代 算法 的 数据 流 框架 通过 一 个 数据 流 值 的 半 格 和 一 组 对 函数 组 合 运算 封闭 的 伟 
递 函 数 来 描述 ， 而 基于 区 域 的 分 析 还 需要 更 多 的 元 素 。 二 个 基于 区 域 的 框架 包括 一 个 数据 流 值 
的 半 格 和 一 个 传递 函数 的 半 格 。 后 一 种 半 格 必须 包括 一 个 交汇 运算 、 一 个 组 合 运算 符 和 一 个 闭 
包 运算 符 。 我 们 将 在 9.7.4 节 看 到 所 有 这 些 元 素 的 作用 。 

基于 区 域 的 分 析 技术 特别 适用 于 那些 包含 环 的 路 径 可 能 改变 数据 流 值 的 数据 流 问题 。 它 的 
闭 包 运算 符 允 许 我 们 概括 描述 一 个 循环 的 运行 效果 ,这 种 方法 比 选 代 分 析 中 的 方法 更 加 有 效 。 
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这 个 技术 对 过 程 间 分 析 也 是 有 用 的 。 在 进行 过 程 间 分 析 时 ， 和 一 次 过 程 调用 关联 的 传递 函数 可 
以 和 那些 与 基本 抉 相关 联 的 传递 函数 一 样 处 理 。 

为 简单 起 见 , 我 们 在 这 一 节 中 将 只 考虑 前 向 数据 流 问 题 。 我 们 将 首先 通过 大 家 熟知 的 到 达 
定 值 的 例子 来 说 明基 于 区 域 的 分 析 技术 的 工作 原理 。 在 9.8 节 中 ， 当 我 们 研究 归纳 变量 的 时 候 ， 
我 们 将 给 出 一 个 有 关 这 个 技术 的 更 有 说 服 力 的 例子 。 

9 天 十 由 区 域 

在 基于 区 域 的 分 析 中 ,程序 被 看 作 是 一 个 区 域 (region) 的 层次 结构 。 区 域 (粗略 地 讲 ) 就 是 二 
个 流 图 中 只 具有 单个 人 口 结 点 的 部 分 。 我 们 会 发 现 , 把 代码 看 作 区 域 层次 结构 的 概念 是 很 直观 
的 ， 因 为 一 个 基于 块 结构 的 过 程 很 自然 地 被 组 织 成 一 个 区 域 层 次 结构 。 在 一 个 块 结构 的 程序 让 ， 
每 个 语句 就 是 一 个 区 域 , 因为 控制 流 只 能 从 一 个 语句 的 开头 进入 。 每 个 语句 模 套 层次 对 应 于 区 
域 层次 结构 中 的 一 层 。 

正式 地 讲 , 流 图 的 一 个 区 域 是 满足 如 下 条 件 的 一 个 结 点 集 N MAE E: 

1) 在 NN 中 有 一 个 支配 入 中 所 有 结 点 的 头 结 点 h。 

2) 如 果 某 个 结 点 m 能 够 不 经 过 到达 NPR n, IA m HEN Po 

3) 是 所 有 位 于 放 中 的 任意 两 个 结 点 Bl ny 之 间 的 控制 流 边 的 集合 。 有 些 进入 hh 的 边 ( 可 
能 ) 不 在 其 中 。 

ERED oh, 一 个 自然 循环 就 是 一 个 区 域 , 但 是 一 个 区 域 不 一 定 包含 一 条 回 边 ,也 不 需要 包 


含 任何 环 。 比 如 , 图 9-47 中 的 结 点 Bl AB, RY B B, 形成 了 一 CB.) 入 口 基本 块 
个 区 域 ; 结 点 Bl S By. B3 以 及 边 B,—B,, B,—B, All B,—B, 也 形成 
一 个 区 域 。 Cr) 


但 是 由 结 点 B, ` B3 以 及 边 B,—B, 组 成 的 子 图 不 是 一 个 区 域 ， 因 
为 控制 流 可 能 从 结 点 B, 或 B; 进入 这 个 子 图 。 更 准确 地 说 , By 和 B 都 
不 支配 另 一 个 结 点 ,因此 违反 了 区 域 定义 中 的 条 件 (1) o ERT Go 
PE STE A C 比如 B ) 作 为 “ 头 结 点 ”, 我 们 还 是 会 违反 条 件 (2), 因为 
我 们 可 以 不 经 过 B, 就 从 B, 到 达 B,, MB, 不 在 这 个 “区 域 ?中 。 ， 口 
9.7. 2， 可 归 约 流 图 的 区 域 层次 结构 | 

在 接 下 来 的 内 容 中 , 我 们 将 假设 流 图 是 可 归 约 的 。 如 果 我 们 偶尔 必须 处 理 不 可 归 约 流 图 的 
话 , 我 们 可 以 使 用 一 种 被 称 为 “ 结 点 分 割 ”的 技术 。 该 技术 将 在 9.7. 6 节 中 讨论 。 

为 了 构造 区 域 的 层次 结构 , 我们 需要 找 出 自然 循环 。 回 顾 一 下 9.6.6 节 , 在 一 个 可 归 约 流 图 
P, 任何 两 个 自然 循环 要 么 不 相交 , 要 么 一 个 循环 嵌 套 在 另 一 个 循环 里 。 在 对 一 个 流 图 进行 “分 
析 ” 并 得 到 它 的 区 域 层次 结构 的 过 程 在 一 开始 的 时 候 把 每 个 基本 块 本 身 看 作 一 个 区 域 。 我 们 把 这 
些 区 域 称 为 叶子 区 域 (leaf region) 。 然 后 , 我 们 把 自然 循环 从 内 到 外 ( 即 从 最 内 层 的 循环 开始 ) 排 
序 。 处 理 一 个 循环 时 ; 我 们 用 两 个 步 又 把 整个 循环 替换 为 一 个 结 点 ; 

1) 首先 ,循环 工 的 循环 体 (所 有 的 结 点 以 及 除了 到 达 循 环 头 的 回 边 之 外 的 所 有 边 ) 被 蔡 换 为 
一 个 结 点 ， 该 结 点 代表 一 个 区 域 R。 原 先 到 达 工 的 循环 头 的 边 现在 进入 代表 的 结 点 。 从 工 的 任 
意 出 口 结 点 出 发 的 边 被 替换 为 从 代表 R 的 结 点 到 达 同 一 个 目标 结 点 的 边 。 但 是 , 如 果 该 边 是 一 
个 回 边 , 那么 它 变 成 了 R 上 的 一 个 圈 。 我 们 把 RR 称 为 循环 体 区 域 (body region) 。 

2) 然后 ,我 们 构造 一 个 代表 整个 自然 循环 5 的 区 域 R'，R' 称 为 一 个 循环 区 域 (loop region ) 。 
和 之 间 的 唯一 区 别 在 于 后 者 包含 了 到 达 工 的 循环 头 的 回 边 。 换 名 话说 , EARP RRR 
时 , 我 们 要 做 的 是 删除 从 R 到 其 自身 的 边 。 


B3 


图 9-47 区 域 的 例子 
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我 们 按照 这 个 方法 不 断 进行 处 理 ， 把 越 来 越 大 的 循环 替换 成 为 单个 结 点 。 在 处 理 时 先 把 特 
环 赫 换 成 为 带 有 圈 的 结 点 ， 再 替换 成 为 不 带 圈 的 结 点 。 因为 可 归 约 流 图 中 的 循环 要 么 相互 嵌 套 ， 
要 么 相互 不 相交 ,所 以 在 按照 这 个 归 约 过 程 构造 得 到 的 一 系列 流 图 中 ， 循环 区 域 结 点 可 以 表示 对 
应 的 自然 循环 的 所 有 结 点 。 

各 个 自然 循环 最 终 都 会 归 约 成 为 单一 的 结 点 。 此 时 ， 要 么 这 个 流 图 被 归 约 为 单个 结 点 ; BRA 
还 有 多 个 结 点 但 是 不 包含 循环 ， 即 归 约 得 到 的 流 图 是 一 个 包含 多 个 结 点 的 无 环 图 。 在 前 一 种 情 
况 下 , 我 们 已 经 完成 了 对 区 域 层次 结构 的 构造 ; 而 在 后 一 种 情况 下 ， 我 们 需要 为 整个 流 图 再 构造 
一 个 循环 体 区 域 。 
PR 考虑 图 9-48a 中 的 控制 流 图 。 在 这 个 流 图 中 有 一 条 从 B, 到 Bp 的 回 边 。 相应 的 区 域 
层次 结构 在 图 9-48b 中 显示 ,图 中 显示 的 边 是 区 域 流 图 的 边 。 图 中 总 共有 8 个 区 域 : 








a) 到 达 定 值 问题 的 例子 流 图 b) 它 的 区 域 层次 结构 
图 9-48 例 9.51 的 控制 流 图 
1) KIR, =, Rs 是 叶子 区 域 , 分 别 代表 了 基本 块 B1 到 B5。 每 个 基本 块 也 是 它 的 区 域 的 


出 口 基 本 块 。 

2) 循环 体 区 域 R 表示 流 图 中 唯一 循环 的 循环 体 。 它 由 区 G> a 
AR RAR 组 成 ,并 介 播 了 三 个 区 域 之 间 的 边 ; BoB, QO) E) 
B,—By, 和 B3 一 B4。 这 个 区 域 有 两 个 基本 块 : B, All Bis AA 
CHEROSEMANM, FEN, Ho-oamT Cs) 


Re 归 约 为 个 结 点 之 后 得 到 的 流 图 。 请 注意 , 虽然 边 ROR, 9 EE EM Eo 
和 Rs—Rs 都 被 蔡 换 为 边 RoR; 3 记 住 RoR; 实际 上 代表 了 
两 条 原来 的 边 是 很 重要 的 。 因 为 我 们 最 终 要 沿 着 这 条 边 传播 OO MASA 的 流 图 
传递 函数 , 所 以 需要 记 住 从 By 或 B 出 发 的 传递 函数 将 到 达 J a AT SR ee 
Rs 的 头 结 点 。 
3) 循环 区 域 R, 代表 整个 自然 循环 。 它 包含 了 一 个 子 区 域 Re 和 一 条 回 边 B4 一 Ba 。 它 也 有 两 个 
出 口 结 点 ,仍然 是 B; 和 Bs。 图 9-49b 中 显示 了 把 整个 自然 循环 归 约 为 Ri 之 后 得 到 的 流 图 。 
4) 最 后 , RRR, 是 顶层 区 域 。 它 包含 三 个 区 域 : 局 、R AR, 以 及 三 条 区 域 之 间 的 边 B1 一 
By, B,— Bs 和 Ba 一 Bs。 当 我 们 把 流 图 归 约 为 Rg 的 时 候 ， 它 就 变 成 单个 结 点 。 因为 没有 回 边 到 达 它 
的 头 结 点 B ， 因 此 不 需要 再 执行 一 个 最 后 的 步骤, 把 这 个 区 域 Rs 归 约 成 为 一 个 循环 区 域 。 O 
我 们 用 下 面 的 算法 来 概括 按照 层次 结构 分 解 一 个 可 归 约 流 图 的 过 程 。 
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| 3k 9. 52 构造 一 个 可 与 约 流 图 的 自 底 向 上 的 区 域 序列 。 

输入 : 一 个 可 归 约 流 图 Co 

输出 : C 的 区 域 的 列表 , 该 列表 可 用 于 基于 区 域 的 数据 流 问题 。 

方法 : 

1) 一 开始 , 列表 中 以 某 种 顺序 包含 了 由 G 的 各 个 基本 块 组 成 的 所 有 叶子 区 域 。 

2) 不 断 选择 满足 如 下 条 件 的 自然 循环 L: 如 果 工 中 包含 了 其 他 的 自然 循环 , 那么 这 些 被 包含 
的 循环 对 应 的 循环 体 区 域 和 循环 区 域 已 经 被 加 入 到 列表 中 。 首 先 把 由 工 的 循环 体 ( 即 循环 过 中 除 
了 到 达 工 的 循环 头 的 各 条 回 边 之 外 的 其 余部 分 ) 组 成 的 区 域 加 入 到 列表 中 , 然后 再 加 入 工 的 循环 
区 域 。 

3) 如 果 整 个 流 图 本 身 不 是 一 个 自然 循环 , 在 列表 的 最 后 加 入 由 整个 流 图 组 成 的 区 域 。 O 





为 什么 叫做 “可 归 约 的 ” 

现在 我 们 可 以 知道 可 归 约 流 图 得 名 的 原因 了 。 虽 然 我 们 不 会 证 明 下 面 的 性 质 , 但 本 书 中 
用 涉及 流 图 的 回 边 来 定义 的 “可 归 约 流 图 "和 其 他 几 个 按照 能 否 把 一 个 流 图 机 械 地 归 约 成 一 
个 结 点 的 定义 方式 实际 上 是 等 价 的 。 在 9. 7. 2 节 中 描述 的 把 自然 循环 塌 缩 成 为 一 个 结 点 的 过 
程 是 上 述 机 械 化 归 约 过 程 的 一 种 。 可 归 约 流 图 的 另 一 个 有 趣 的 定义 是 可 以 按照 下 列 方法 被 归 
约 成 为 一 个 结 点 的 所 有 流 图 : 

Ty: 删除 从 一 个 结 点 到 达 自 身 的 边 。 

Ty: 如 果 结 点 n 有 唯一 的 前 驱 m, 并 且 nn 不 是 流 图 的 人口 结 点 ,那么 把 m 和 合并 。 
9.7.3 基于 区 域 的 分 析 技 术 概 述 

对 于 每 个 区 域 尺 以 及 每 个 尺 中 的 子 区 域 R', 我 们 计算 一 个 传递 函数 六 wir] KHET R 
部 的 从 的 入 口 到 R' 的 入 口 的 全 部 可 能 路 径 的 执行 效果 。 如 果 存 在 一 条 从 区 域 R 中 的 基本 块 B 
到 达 尺 之 外 的 基本 块 的 边 , 我 们 就 说 8 是 R 的 一 个 出 口 基本 块 (exit block), 我 们 也 为 及 中 的 每 
个 出 口 基本 块 B 计 算 一 个 传递 函数 , EH fr, ourtg]。 这 个 传递 函数 概括 了 所 有 在 RR 中 从 RR 的 入 
口 基 本 块 到 达 B 的 出 口 处 的 所 有 可 能 路 径 的 执行 效果 。 

然后 我 们 沿 着 这 个 区 域 层次 结构 逐步 向 上 , 为 越 来 越 大 的 区 域 计算 传递 函数 。 我 们 从 由 单 
个 基本 块 组 成 的 区 域 开始 。 对 于 任何 一 个 这 样 的 区 域 8, fy ee] 就 是 一 个 单元 函数 ， 而 
fe, our[8] 则 是 基本 块 B 自身 的 传递 函数 。 当 我 们 沿 着 层次 结构 向 上 时 ， 

。 如 果 尺 是 一 个 体 区 域 , 那么 属于 R 的 边 构 成 了 的 子 区 域 的 一 个 无 环 图 。 我 们 可 以 按 昭 

子 区 域 的 拓扑 排序 计算 传递 函数 。 

。 如 果 民 是 一 个 循环 区 域 , 那么 我 们 只 需要 考虑 到 达 R 的 头 结 点 的 回 边 的 效果 。 

最 终 我 们 必然 会 到 达 层 次 结构 的 顶部 , 并 计算 得 到 对 应 于 整个 流 图 的 区 域 R, 的 传递 函数 。 
在 算法 9.53 中 描述 了 计算 过 程 。 

下 一 步 是 计算 各 个 基本 块 的 人 口 和 出 口 处 的 数据 流 值 。 我 们 按照 相反 的 方向 , 从 区 域 R, FE 
始 沿 着 层次 结构 向 下 处 理 各 个 区 域 。 对 于 每 个 区 域 , 我 们 计算 其 入口 处 的 数据 流 值 。 对 于 区 域 
Ra, 我 们 应 用 fr,, mir] (IN[LENTRY] ) 来 计算 R, 的 子 区 域 尺 的 入 口 处 的 数据 流 值 。 我 们 重复 这 
个 过 程 , 直到 到 达 位 于 区 域 层 次 结构 中 的 叶子 上 的 基本 块 为 止 。 
9.7.4 有 关 传 递 函 数 的 必要 假设 
为 了 使 得 基于 区 域 的 分 析 能 够 解决 问题 ,我 们 要 对 框架 中 的 传递 函数 集合 的 性 质 作出 某 些 
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假设 。 明 确 地 说 ， 我 们 需要 作用 于 传递 函数 之 上 的 三 个 基本 原子 运算 : 组 合 、 交 汇 运算 和 闭 包 运 
算 。 使 用 闪 代 算法 的 数据 流 框架 只 需要 其 中 的 第 一 个 运算 。 
组 合 
_ 个 结 点 序列 的 传递 函数 可 以 把 表示 各 个 结 点 的 传递 函数 组 合 起 来 得 到 。 Sfi Ail fy 是 结 点 
ny 和 nz 的 传递 函数 。 执 行 nl 再 执行 的 效果 可 以 用 函数 户 。fi 来 表示 。 函 数组 合 已 经 在 9. 2.2 
节 中 讨论 过 , 并 且 在 9.2.4 节 中 用 到 达 定 值 给 出 了 一 个 例子 。 为 了 回顾 一 下 , 令 gen; M kill; 是 大 
的 gen FI kill BE. BLA 
fo efi (%) =gen UC (gen, U (x — kill, ) ) — kill, ) 
= ( gen, U (gen, —kill,)) U(x- (kill, U kill, ) ) 
因此 , fo ofi 的 gen 和 kill RAIE (gen U (gen - killa) ) All (kill, U kill, )。 对 于 所 有 具有 gen- 
kil 形式 的 传递 函数 , 这 个 想法 都 是 可 行 的 。 其 他 形式 的 传递 函数 可 能 也 对 组 合 运 算 封 闭 ， 但 是 
我 们 必须 单独 考虑 各 种 情况 。 
交汇 运算 
这 里 , 传递 函数 集合 本 身 就 是 一 个 具有 交汇 运算 Ny 的 半 格 的 值 域 。 两 个 传递 函数 用 和 万 的 
Z, WA Ah 被 定义 为 (fh Ah) (%) sA Aha) RE 人 是 数据 流 值 的 交汇 运算 。 传 递 函 
数 上 的 交汇 运算 用 来 把 具有 相同 结尾 点 的 不 同 执行 路 径 的 执行 效果 组 合 起 来 。 从 现在 开始 , 在 
不 会 引起 歧义 时 我 们 把 传递 函数 的 交汇 运算 也 写成 人 。 对 于 到 达 定 值 框架 , 我 们 有 
(fi Afr) (x) =f, (x) A h(x) 
= ( gen, U (x — kill, ) ) U ( gem U (x ~ hilly) ) 
= (gen, Ugen) U (x - (hill, Nkill,)) 
也 就 是 说 , fı Af 的 gen 和 kill 集合 分 别 是 gen, Ugen, Fil kill, N kill, o 仍然 和 处 理 组 合 运 算 一 样 ， 
对 于 任何 gen-kill 形式 的 传递 函数 集合 都 可 以 进行 同样 的 处 理 。 
闭 包 
如 果 了 表示 一 个 环 的 传递 函数 , 那么 f" 表示 沿 着 这 个 环 执行 n 次 的 效果 。 当 不 知道 兴 代 次 
数 的 时 候 , 我 们 必须 假设 这 个 环 将 被 执行 0 AZK, RIMS, 即 / 的 闭 包 来 表示 这 样 的 循环 的 
传递 函数 。 闭 包 f* 的 定义 如 下 
A sAr 
请 注意 , f° 必须 是 单元 传递 函数 ， 因为 它 代表 把 这 个 循环 执行 0 次 的 效果 ， 即 从 入 口 处 开始 但 不 
运行 的 效果 。 如 果 令 1 表示 单元 传递 函数 ， 那么 可 以 把 上 式 写 成 
PERUT) 
feb de 1h SIS LEME HEERS A gern RAA kil Ro WA, 
f°(%) =f(f(x)) 
= genU((genU (x ~- kill) ) - kill) 
= genU (x — kill) 
f(x) =f @)) 
= gen U (x — kill) 
以 此 类 推 , 即 所 有 的 f” 都 是 genU (x-kill) 。 也 就 是 说 , 如果 传递 函数 具有 gen-hill 形式 , 那么 沿 
着 一 个 循环 执行 的 次 数 对 该 函数 没有 影响 。 因 此 ， 
f° (x) STA Y A E Av 
=xU (genU (x%— kill) ) 
= gen Ux 
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”也 就 是 说 ,传递 函数 庆 的 gen A kill RADIE gen 和 0。 直观 地 讲 ， 因 为 我 们 可 能 根本 不 沿 着 
这 个 循环 执行 , x 中 的 任何 元 素 都 可 以 到 达 这 个 循环 的 入 口 处 。 在 此 后 的 所 有 和 迭代 中 ， 到达 定 值 
中 总 是 包括 所 有 在 gen 集合 中 的 元 素 。 
9.7.5 一 个 基于 区 域 的 分 析 算 法 

下 面 的 算法 根据 某 个 满足 9.7.4 节 中 假设 的 框架 , 解决 了 一 个 可 归 约 流 图 上 的 前 向 数据 流 分 
析 问 题 。 回 顾 一 下 , fe, ner ASR, oute) 是 两 个 传递 函数 , 它们 把 区 域 的 入 口 点 上 的 数据 流 值 
分 别 转 换 为 在 子 区 域 R* 入 口 处 和 出 口 基本 块 B 的 出 口 处 的 数据 流 值 。 


基于 区 域 的 分 析 。 

输入 : 一 个 具有 9.7.4 节 中 所 列 性 质 的 数据 流 框架 和 一 个 可 归 约 流 图 Co 

输出 : GC 中 的 每 个 基本 块 B 的 数据 流 值 IN[B]。 

方法 : 

1) 使 用 算法 9. 52 来 构造 CG 的 自 底 向 上 的 区 域 序列 , 假设 它们 是 RI, R, e, R,, HR, 是 
最 顶层 的 区 域 。 

2) 进行 自 底 向 上 的 分 析 , 计算 概括 了 每 个 区 域 的 执行 效果 的 传递 函数 。 对 于 按照 自 底 向 上 
顺序 排列 的 每 个 区 域 Ri ，R2 ，…，R,， 进 行 下 列 计算 : 

@ 如 果 尺 是 一 个 对 应 于 基本 块 B 的 叶子 区 域 , Sfr, inte) = Sr, outta] = 户 。 其 中 ,万 是 基 
本 块 B 的 传递 函数 。 

D 如 果 丸 是 一 个 循环 体 区 域 , 执行 图 9-50a 中 的 计算 。 

© 如 果 尺 是 一 个 循环 区 域 , 执行 图 9-50b 中 的 计算 。 

3) 进行 自 顶 向 下 的 扫描 , 找 出 各 个 区 域 开始 处 的 数据 流 值 。 

@) IN[ R,, ] = IN[ ENTRY]. 

O 按照 自 项 向 下 的 顺序 , 对 {RI ，R2，…，R。 1 中 的 每 个 区 域 尺 计算 

IN[R] =fr, meri (INLR']) 

HP AAPA EMR MK, 


1) for (按照 拓扑 排序 ， 对 于 每 个 直接 包含 于 尽 
的 子 区 域 S) { 
2) JRINIS] = 八 S 的 头 结 点 在 有 R 中 的 前 驱 B JajOUTIB]; 
/* 如 果 S 是 区 域 R 的 头 ， 那 么 Ír INS 就 是 


对 空 集 应 用 交汇 运算 的 结果 ， 也 就 是 单元 函数 */ 
3) for (5 中 的 每 个 出 口 基本 块 B) 
fR,OUTLB] = ÍS,OUTIB] ° frntsii 





a) 构造 一 个 循环 体 区 域 R 的 传递 函数 


令 5 为 直接 包含 于 民 的 循环 体 区 域 ， 就 是 说 SHEN RH 
删除 了 到 达 及 的 头 结 点 的 回 边 后 得 到 的 区 域 


JRiINIsl = (As 的 头 结 点 在 R 中 的 前 驱 Bf5,0UT[B]) 


* 
了 


for ( 尽 中 的 每 个 出 口 基本 块 妃 ) 
fR,OUTIB] = fs,OUTIB] ° fR INIS]; 





b) 为 一 个 循环 区 域 R' 构 造 传递 函数 


图 9-50 “基于 区 域 的 数据 流 计 算 的 细节 
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让 我 们 首先 看 一 下 算法 中 自 底 向 上 分 析 过 程 的 工作 细节 。 在 图 9-50a 的 第 (1) 行 中 , 我 们 按 
照 某 个 拓扑 排序 访问 一 个 循环 体 区 域 的 各 个 子 区 域 。 第 (2) 行 中 计算 的 传递 函数 代表 了 所 有 从 R 
的 头 结 点 到 5 的 头 结 点 的 可 能 路 径 的 执行 效果 ; 第 (3) 和 (4) 行 中 计算 的 传递 函数 代表 了 所 有 从 
R 的 头 结 点 到 的 出 口 点 ( 即 所 有 的 某 个 后 继 在 S 之 外 的 基本 块 的 出 口 点 ) 的 可 能 路 径 的 执行 效 
果 。 请 注意 , 按照 第 (1) 行 所 构造 的 拓扑 排序 , R 的 所 有 前 驱 8' 必 然 在 5 之 前 的 区 域 中 。 这样， 
Fre, oun, a 一定 已 经 在 算法 的 外 层 循环 的 前 面 某 次 迄 代 中 由 第 (4) 行 计算 完毕 。 

对 于 循环 区 域 , 我 们 执行 图 9-50b 中 第 (1) 到 (4) 行 的 各 个 步骤 。 其 中 , 第 (2) 行 计算 了 沿 着 
循环 体 区 域 $ 重复 执行 零 次 或 多 次 的 效果 。 第 (3) 和 第 (4) 行 计算 了 进行 一 次 或 多 次 迭代 之 后 在 
循环 出 口 处 的 效果 。 

在 算法 的 自 顶 向 下 扫描 中 , 步 又 3(a) 首 先 把 问题 的 边界 条 件 作为 最 顶层 区 域 的 输入 。 然 后 , 如 
果 尺 直接 包含 于 及 ,我 们 只 需要 将 传递 函数 充 , Nt 应 用 到 IN R ] 就 可 以 计算 得 到 INIR]。 O 
让 我 们 应 用 算法 9. 53 来 寻找 图 9-48a 中 流 图 的 到 达 定 值 。 第 一 步 构造 出 自 底 向 上 访 
问 各 个 区 域 的 顺序 ; 这 个 顺序 将 作为 各 个 区 域 的 下 标 , 比如 Ri ,Rs,…, Rao 

五 个 基本 块 的 gen SEAN kill 集 的 值 概括 如 下 : 


By B, B3 Ba Bs 
{d,, 43,43} {dg} tds} td} 
(dy, ds, dg} tdi}. , dst, dd 




























请 回忆 一 下 9.7.4 节 中 对 gen-kill 形式 的 传递 函数 的 简化 后 的 规则 : 
。 要 计算 传递 函数 的 交汇 , 只 要 计算 gen 集合 的 并 集 和 hill 集合 的 交集 。 
。 组 合 传递 函数 时 , 计算 两 个 函数 的 gen 集 的 并 集 和 有 lL 集 的 并 集 。 但 是 这 个 规则 有 一 个 例 
外 ， 当 一 个 表达 式 被 第 一 个 函数 生成 且 没 有 被 第 二 个 函数 生成 ， 同时 又 被 第 二 个 函数 杀 
死 的 时 候 , 这 个 表达 式 不 在 最 后 的 gen 中 。 
。 在 计算 一 个 传递 函数 的 闭 包 时 , 保持 原来 的 gen 集合 , 但 是 用 0 蔡 代 原来 的 1 集合 。 
前 面 的 五 个 区 域 R; 9g Rs 分 别 是 基本 块 Bi 9g Bs. 对 于 1<i<5 » Ie. IN[8,] 都 是 单元 函 
数 , 六 ,ourts] 是 Bi 的 传递 函数 : 
Jp ,ouTIBi] (x) = (x ~ killp,) Ugeng, 
算法 9.53 的 第 二 步 构造 的 其 他 传递 函数 如 图 9-51 Ho KI Re HEH Ro, Ry 和 Ry, 组 成 ， 
Re 代表 该 循环 的 循环 体 ， 因此 不 包含 回 边 B4 一 B。。 对 这 些 区 域 的 处 理 顺 序 就 是 它们 的 唯一 的 拓 
扑 排 序 : R,、R3、R4。 首 先 请 记 住 边 B>B, BAT Re 24h, R 在 Re 中 没有 前 驱 。 因 此 
Fre, NB,] 是 单元 函数 ， 而 fr， our[B;] 是 B, 本 身 的 传递 函数 。 
区 域 B3 的 头 结 点 有 一 个 Re 中 的 前 驱 , 即 R0 到 达 它 的 人 口 处 的 传递 函数 就 是 到 达 By 出口 
处 的 传递 函数 fk。, ournt By] ° 这 个 函数 已 经 被 计算 出 来 。 我 们 把 这 个 函数 和 By 的 传递 函数 组 合 
起 来 , 计算 出 到 达 Bs 出 口 处 的 传递 函数 。B3 就 在 由 它 自身 组 成 的 区 域 中 。 
最 后 , 因为 B 和 B, 都 是 R, 的 头 结 点 B4 的 前 驱 ， 对 于 到 达 Rs 入口 处 的 传递 函数 , 我 们 必 
须 计算 





O 严格 地 讲 , 我 们 说 的 是 fr。, ntip]， 但 是 对 类 似 于 Rs 这 样 的 单 基本 块 区 域 ， 如 果 我 们 在 这 个 上 下 文 环境 下 使 用 基 
本 块 名 字 而 不 是 区 域名 字 的 话 , 文字 表述 通常 会 更 清楚 。 
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传递 函数 gen d kill 
Re | fre INiRa) =I 0 人 
fre OUT{B2] = fro, OUTIB2) ° fre INIR] {da} {di} 
Fre INiRa) = fre, OUTIB2] {da} {di} 
fre OUT Bs) = frg\OUT Bs) ° fre INIRs] {dads} {di,ds} 
Íre INiRa] = fre OUT{B2) ^ fre, OUTIBs) | {44145} {di} 
| fre OUTIBA = fra OUT (Ba) ° fre INIRa) {d4, ds, de} {di, d2} | 
ee Ír- INIRa] = fr,OUT Ba] {da, ds, de} 0 
frr,OUTIBs] = fRe,OUT[Bs]° fRr,IN[Re] {da, ds, de} {di, d3} 
bi fr,,OUT {Ba = fre,OUT{Ba] 9 fr; INIRel {da, ds, de} {di,d2} 
Rs | fra,IN[Ri] 二 | 0 0 
fka OUT) = fr OÙTIB:] {di; d2, d3} {d4, ds, de} 
fRs,IN[R7] = fre OUTIB: {di,d2,ds} {da,ds, de} 
fas OUTIB FE Íri, OUT{Bs) 9 Íra INter) {d2, da, ds, de} {di, ds} 
fra,OUTIBs] = frz,OUT (Bs) ° frs INIR) {ds, da, ds, de} {di, d2} 
fRs,IN[Rs] = fra OUT [Bs] ^ fra,OUTIBs) | {d2 ds, da, ds, do} | {d1} 
E F tg, OUT(Bs] = frs, OUTIBs) ° frs INIRs)] {d2, ds, da, ds, de} | {di} 








图 9-51 使 用 基于 区 域 的 流 分 析 计算 图 9-48a 中 流 图 的 传递 函数 


fr, outte,) NfRe, OUT[B,] 

这 个 传递 函数 和 传递 函数 /rourrs,] 组 合 , 得 到 我 们 想 要 的 函数 如。 oute] 请 注意 ,比如 ,ds 
没有 在 这 个 函数 中 被 杀 死 , HA B>B, 没有 对 变量 a 重新 定 值 。 

现在 考虑 循环 区 域 Rj。 它 只 包含 一 个 表示 它 的 循环 体 的 区 域 Re。 因 为 只 有 一 个 到 达 Re 的 
头 结 点 的 回 边 By —>B, , 代表 这 个 循环 体 执行 0 次 或 者 多 次 的 传递 函数 就 是 fR, ouT[B,]: 这 个 函数 
的 gen AE |da, ds, dg}, M kill RAO. RMR, 有 两 个 出 口 ， 即 基本 块 B3 M B, o 因此 , 这 
个 传递 函数 和 Re 的 各 个 传递 函数 相 组 合 , 得 到 对 应 于 Ry 的 传递 函数 。 请 注意 某 些 定 值 ， 比 如 
de, 是 怎样 因为 路 径 B,>B,—>B,—B,, 甚至 路 径 B,>B, +B, —>B,—B, 的 原因 而 被 加 入 到 函数 
fr,, our[B,] 的 gen 集中 去 的 。 

最 后 考虑 区 域 R。, 即 整 个 流 图 。 它 的 子 区 域 是 Ri、Rj 和 及。 我 们 将 按照 这 个 拓扑 顺序 考虑 
这 些 子 区 域 。 和 前 面 一 样 , 传递 函数 fr, mts,] 是 一 个 单元 函数 ， 而 传递 函数 fr, ovr a, | 是 
Ír, ouT[B1]， 也 就 是 fp o 

Rj 的 头 结 点 B 只 有 一 个 前 驱 By, 因此 到 达 它 的 入 口 的 传递 函数 就 是 Re 中 从 B: 离开 的 传 
递 函 数 。 我 们 把 fr,, ovre] MR 中 到 达 B3 AB, th 口 处 的 传递 函数 相 组 合 , 得 到 它们 在 Rs PH 
应 的 传递 函数 。 最 后 我 们 考虑 Rs, 它 的 头 结 点 Bs 在 Rs 中 有 两 个 前 驱 , 即 B3 和 B4。 因 此 , 我 们 
WH fR, OUTER] ASR, outta, ] 可 以 得 到 fg,, INEB] © 因为 基本 块 B; 的 传递 函数 是 单元 函数 , 因此 
Fr, , OUT[ Bs ] =fr,, IN[ Bs ] ° 

第 三 步 根据 传递 函数 计算 实际 的 到 达 定 值 。 在 步骤 3(a), INR] =0, 因为 在 程序 的 开头 没 
有 到 达 定 值 。 图 9-52 显示 了 步骤 3(b) 是 如 何 计算 其 余 的 数据 流 值 的 。 这 个 步骤 从 Rs 的 各 个 子 
区 域 开始 。 因 为 从 Rs 的 开始 处 到 它 的 各 个 子 区 域 开始 处 的 传递 函数 已 经 计算 出 来 了 , 通过 简单 
地 应 用 这 些 传递 函数 就 可 以 找到 各 个 子 区 域 的 开始 处 的 数据 流 值 。 我 们 重复 这 个 步骤 ,直到 得 
到 各 个 叶子 区 域 的 数据 流 值 为 止 。 这 些 叶子 区 域 就 是 各 个 基本 块 。 请 注意 , 图 9-52 中 显示 的 数 
据 流 值 和 我 们 对 相同 流 图 应 用 迭代 数据 流 分 析 技 术 而 得 到 的 值 是 完全 一 致 的。 当然 , 这 两 组 值 
必须 一 致 。 E 
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IN[Rs] 
In[Ri] 
IN[R7] 
IN[Rs] 


人 

{d;,d2, d3} 

{dz, d3, d4, ds, de} 
{d1, d2, d3, d4, d5, de} 
{d2, d3, d4, ds, de} 
{d2, d3, d4, dz, de } 
{di1, d2, d3, d4, ds, de } 


0 

fre tN{Ri) (IN[Re]) 
Íra INIR: (IN[Rs]) 
fRg,INIRs](IN[Re]) 
fR7,IN[Ro] (IN[R7]) 
JRsiINIRUN[Re]) 
fedINIRsl(IN[Ee]) 
fReINIR2I(IN[Re]) 


IN[Re] 
IN[R4] 
IN[Rs] 
IN[Ro] 


Hou de we we th wea 


WoW toa ll 





A952 ”基于 区 域 的 流 分 析 的 最 后 一 步 


9.7.6 处 理 不 可 归 约 流 图 

如 果 预 计 到 需要 用 编译 器 或 其 他 程序 处 理 软件 进行 处 理 的 程序 中 经 常会 有 不 可 归 约 流 图 ， 
那么 我 们 建议 使 用 迭代 算法 , 而 不 是 基于 层次 结构 的 方法 来 解决 数据 流 分 析 问 题 。 但 是 , 如 果 我 
们 只 准备 偶尔 处 理 一 下 不 可 归 约 流 图 , 那么 使 用 下 面 的 “ 结 点 分 割 ” 技 术 就 足够 了 。 

首先 尽 可 能 依据 自然 循环 构造 区 域 。 如 果 流 图 是 不 可 归 约 的 , 我 们 会 发 现 得 到 的 流 图 包含 
环 , 但 是 没有 回 边 , 因此 我 们 不 能 进一步 对 这 个 流 图 进行 分 析 。 在 图 9-53a 中 显示 了 一 种 典型 的 
情形 。 这 个 流 图 和 图 9-45 中 的 不 可 归 约 流 图 具有 同样 的 结构 , 但 是 就 像 图 9-53 中 的 结 点 内 的 小 
结 点 所 显示 的 , 这 个 流 图 的 结 点 可 能 实际 上 是 一 个 复杂 的 区 域 。 

我 们 选取 一 个 具有 多 个 前 驱 , BRERA RR, MRR Ak PRR, 那么 
建立 个 对 应 于 RR 的 整个 流 图 的 拷贝 , 并 将 的 头 结 点 的 个 前 驱 分 别 连接 到 不 同 的 拷贝 。 请 记 
住 , 只 有 一 个 区 域 的 头 才 可 能 具有 区 域 之 外 的 前 驱 。 我 们 只 是 给 出 (而 不 准备 证 明 ) 下 面 的 结论 : 
这 样 的 结 点 分 割 的 结果 是 , 在 寻找 新 的 回 边 并 构造 出 这 些 回 边 的 区 域 之 后 , 区域 的 个 数 至 少 减少 
了 一 。 这 样 得 到 的 流 图 可 能 还 是 不 可 归 约 的 ,但 是 我 们 可 以 不 断交 蔡 进 行 两 个 步骤 : 结 点 分 割 步 
DE, 寻找 新 自然 循环 并 将 其 塌 缩 为 单个 结 点 的 步 又。 最 终 我 们 会 得 到 单个 区 域 ， 即 流 图 已 经 被 完 
全 归 约 。 





图 9-53 ”复制 一 个 区 域 使 得 一 个 不 可 归 约 流 图 变 成 可 归 约 的 


图 9.535 中 显示 的 结 点 分 割 把 边 RR 变 成 了 一 个 回 边 , 因为 现在 Rs 支配 Ras。 因 
此 这 两 个 区 域 可 以 合 二 为 一 。 得 到 的 三 个 区 域 一 一 R1、R2。 及 新 产生 的 区 域 一 -组 成 了 一 个 新 的 
无 环 的 流 图 ,因此 可 能 被 组 合 到 单个 循环 体 区 域 中 。 这 样 我 们 就 把 整个 流 图 归 约 为 单个 区 域 。 
二 般 来 讲 , 可 能 还 需要 更 多 的 分 割 处 理 , 在 最 坏 的 情况 下 , 最 后 得 到 的 基本 块 的 个 数 可 能 和 原 流 
图 中 基本 块 的 个 数 成 指数 关系 。 口 
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我 们 想 要 的 是 针对 原 流 图 的 答案 。 因 此 我 们 还 必须 考虑 对 分 割 所 得 流 图 的 数据 流 分 析 结 果 
和 这 个 答案 之 间 的 关系 。 我 们 可 以 考虑 两 个 方法 : 

1) 分 割 区 域 可 能 有 益 于 优化 过 程 , 我 们 可 以 简单 地 修订 这 个 流 图 使 得 只 有 某 些 基 本 块 被 复 
制 。 到 达 每 个 基本 块 副本 的 路 径 可 能 只 是 到 达 原 基本 块 的 路 径 的 一 个 子 集 。 因 此 相对 于 原 基 本 
块 上 的 数据 流 值 而 言 , 在 这 些 基 本 块 副本 上 的 数据 流 值 可 能 包含 更 加 精确 的 信息 。 比 如 , 到 达 每 
个 基本 块 副本 的 定 值 要 少 于 到 达 原 基本 块 的 定 值 。 

2) 如 果 我 们 希望 不 是 真 的 分 割 而 是 想 保 留 原来 的 流 图 , 那么 在 分 析 完 分 割 所 得 的 流 图 之 后 ， 
我 们 可 以 查看 每 个 被 分 割 基本 块 B, 以 及 它 对 应 的 拷贝 集合 B, B2, e, Bi。 我 们 可 以 计算 IN 
[B] =IN[B1] AIN[B;] A AIN[B;], 并且 类 似 地 计算 OUT 值 。 

9.7.7 9.7 节 的 练习 

练习 9. 7.1: 对 于 图 9-10 的 流 图 ( 见 9.1 节 中 的 练习 ) : 

1) 寻找 所 有 可 能 的 区 域 。 但 是 你 可 以 忽略 区 域 列表 中 那些 只 有 一 个 结 点 且 没 有 边 的 区 域 。 

2) 给 出 算法 9. 52 所 构造 的 嵌 套 区 域 的 集合 。 

3) 按照 9.7.2 节 中 “为 什么 叫做 可 归 约 的 ”部 分 中 所 描述 的 方法 , 给 出 该 流 图 的 一 个 T -T 
归 约 。 

45 9.7.2: 在 下 列 流 图 上 重复 练习 9.7.1: 

1) 图 9-3。 

2) 图 8-9。 

3) 你 在 练习 8.4.1 中 得 到 的 流 图 。 

”4) 你 在 练习 8. 4. 2 中 得 到 的 流 图 。 

练习 9. 7. 3: 证 明 每 个 自然 循环 都 是 一 个 区 域 。 

1! 练习 9.7.4: 说 明 一 个 流 图 是 可 归 约 的 当 且 仅 当 它 可 以 按照 下 列 方式 被 转化 成 为 单一 
结 点 : 
1) 9.7.2 节 的 “为 什么 叫做 可 归 约 的 ”部 分 中 描述 的 7 和 7 运算 。 

2) 9.7.2 节 中 引入 的 区 域 定 义 。 
| 练习 9.7.5: 说 明 如 果 你 对 一 个 不 可 归 约 流 图 应 用 结 点 分 割 技 术 , 然后 对 分 割 后 得 到 的 流 
图 进行 Ti -T, 归 约 , 你 最 后 得 到 的 流 图 的 结 点 一 定 严 格 少 于 原 流 图 的 结 点 数目 。 

| 练习 9.7.6: 如 果 你 交替 地 使 用 结 点 分 割 技术 和 T - 7, 归 约 来 归 约 一 个 具有 个 结 点 的 

完全 有 向 图 , 会 发 生 什么 情况 ? 


9.8 符号 分 析 


在 本 节 中 , 我 们 将 使 用 符号 分 析 来 说 明基 于 区 域 的 分 析 技术 的 使 用 。 在 这 个 分 析 中 ,我 们 用 
符号 表示 的 方式 跟踪 程序 中 的 变量 的 值 , 把 这 些 变量 的 值 表示 为 关于 


x = input(); 


输入 变量 及 其 他 变量 的 表达 式 。 我 们 把 这 些 变量 称 为 参考 变量 。 用 同 E a: 
一 组 参考 变量 来 表示 变量 的 值 可 以 描绘 出 这 些 变量 之 间 的 关系 。 符 号 2 
分 析 可 以 被 用 于 多 种 目的 ,比如 优化 、 并 行 化 和 用 于 程序 理解 的 分 析 。 | 5) agl o 
考虑 图 9-54 中 的 简单 程序 的 例子 。 这 里 我 们 使 用 * 作为 只 Tm 





一 的 参考 变量 。 符 号 分 析 会 发 现在 第 2 行 和 第 3 行 中 分 别 对 y 和 z 赋 
值 的 语句 执行 之 后 , y 和 z 的 值 分 别 是 x-1 和 zx-2。 这 个 信息 是 很 有 ”图 9-54 说 明 符号 分 析 
用 的 。 比 如 , 可 以 用 来 确定 在 第 4 行 和 第 5 行 中 的 赋值 语句 将 会 在 不 动机 的 一 个 例子 程序 
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同 的 内 存 位 置 卡 进行 写 运 算 , 因而 是 可 以 并 行 执行 的 。 并 且 , 我 们 还 可 以 指出 条 件 z>% 永 还 个 
可 能 为 真 , 从 而 允许 优化 程序 把 第 6 行 和 第 7 行 的 条 件 语句 全 部 删除 。 口 
9.8.1 参考 变量 的 仿 射 表达 式 

天 为 我 们 不 可 能 为 所 有 计算 得 到 的 值 创建 一 种 简洁 而 又 封闭 的 符号 表达 式 , 所 以 选择 了 
不 抽象 域 , 并且 使 用 域 中 的 最 精确 的 表达 式 来 近似 表达 计算 结果 。 在 此 之 前 我 们 已 经 看 到 了 这 
个 策略 的 一 个 例子 : 常量 传播 。 在 常量 传播 中 ,我 们 的 抽象 域 由 所 有 常量 值 和 特殊 符号 UNDEF 
及 NACAR, JUP, UNDEF 表示 我 们 尚未 决定 该 值 是 否 为 常量 ， 而 当 已 经 发 现 一 个 变量 不 是 党 
量 的 时 候 使 用 NAC。 

我 们 在 这 里 给 出 的 符号 化 分 析 技 术 尽 可 能 地 把 值 表示 成 为 参考 变量 的 仿 射 表达 式 。 如 年 一 
SEFER o, v, =, v 的 表达 式 可 以 被 表示 为 co +c1v1 + … + ntn, 那么 这 个 表达 式 就 是 仿 身 
的 。 其 中 co, c, e, Cy 都 是 常量 。 这 样 的 表达 式 也 被 非 正式 地 称 为 线性 表达 式 严格 地 讲 ， 从 
有 当 co =O 的 时 候 , 仿 射 表达 式 才 是 线性 的 。 我 们 对 仿 射 表达 式 感 兴趣 的 原因 是 循环 中 的 数组 下 
标 经 常 可 以 表示 成 仿 射 表达 式 一 这 些 信息 可 用 于 优化 和 并 行 化 处 理 3 在 第 11 章 中 ,我 们 将 更 
详细 地 讨论 这 个 主题 。 f 

归纳 变量 

一 个 伪 射 表达 式 不 一 定 只 能 使 用 程序 变量 作为 参考 变量 ; 它 也 可 以 使 用 一 个 循环 的 挝 代 次 
数 作为 参考 变量 。 如 果 一 个 变量 在 某 个 程序 点 上 的 值 能 够 被 表示 为 cti teo, 其 中 i 是 包 合 该 程序 
点 的 最 内 层 循环 的 迭代 次 数 , 那么 这 个 变量 称 为 归纳 变量 (induetion variable) 。 
考虑 代码 片断 


for (m = 10; m < 20; m++) 
{ x = m*3; A[x] = 0; } 


假设 我 们 为 该 循环 引入 一 个 变量 ;来 表示 已 执行 的 迭代 次 数 。 在 循环 第 一 次 迭代 时 , i 的 值 是 0， 
第 二 次 迭代 的 时 候 ;的 值 是 1, 以 此 类 推 。 我 们 可 以 把 变量 m 表示 成 为 i 的 一 个 仿 射 表达 式 , 也 
就 是 m=i+10。 变 量 x, 也 就 是 3m， 在 循环 的 连续 迭代 中 的 取 值 是 30, 33, …, 57。 因 此 % 具 有 
仿 射 表达 式 x*=30 +3i。 我 们 说 m 和 x 都 是 这 个 循环 的 归纳 变量 。 a 

把 变量 表示 成 为 循环 次 数 的 仿 射 表达 式 使 得 我 们 可 以 直接 计算 该 变量 在 各 次 迭代 中 的 值 ， 
而 且 能 够 实现 多 种 代码 转换 。 一 个 归纳 变量 在 循环 的 各 次 迭代 中 所 取 的 值 可 以 通过 加 法 运算 ， 
而 不 是 乘法 运算 计算 得 到 。 这 个 转换 称 为 “强度 消减 ”。 它 已 经 在 8. 7 节 和 9.1 节 中 介绍 过 了 。 
比如 , 我 们 可 以 从 例 9.57 的 循环 中 消除 乘法 运算 *=m*3， 只 要 把 程序 改写 为 : 


L= 23 
for (m = 10; m < 20; m++) 
{ x = x+3; A[x] = 0; } 


另外 , 请 注意 在 该 循环 中 被 赋予 0 值 的 内 存 位 置 , 即 &4 +30, &A +33, 0, &A +57, 也 都 是 
循环 迭代 次 数 的 仿 射 表达 式 。 实 际 上 ， 这 些 整 数值 是 该 循环 中 唯一 需要 进行 计算 的 值 ; 我 们 只 需 
要 保留 mn 或 x 中 的 一 个 。 上 面 的 代码 可 以 直接 替换 为 下 面 的 代码 : 


for (x = &A+30; x <= &A+57; x = x+3) 
#X = 0; 


除了 加 快 计算 速度 , 符号 化 分 析 对 于 实现 并 行 化 也 是 有 用 的 。 当 循 环 中 的 数组 下 标 是 循环 
迭代 次 数 的 仿 射 表达 式 时 ， 我 们 可 以 考虑 不 同 迭 代 中 的 数据 访问 的 关系 。 比 如 ， 我 们 可 以 指出 在 
每 次 送 代 中 被 写 人 的 内 存 位 置 是 不 同 的 ， 因此 循环 的 全 部 迭代 可 以 在 不 同 的 处 理 器 上 并 行 执行 。 
这 样 的 信息 在 第 10 章 和 第 11 章 中 被 用 来 从 顺序 程序 中 抽取 并 行 性 。 

其 他 参考 变量 

如 果 一 个 变量 不 是 我 们 已 选取 的 参考 变量 的 线性 函数 ， 我 们 还 可 以 选择 把 它 的 值 当 作 将 来 
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进行 的 运算 的 参考 变量 。 比 如 , 考虑 下 面 的 代码 片段 : 
3 a 
caat 1t 


虽然 在 上 面 的 函数 调用 之 后 a 的 值 本 身 不 能 被 表示 成 任何 参考 变量 的 线性 函数 , 但 它 仍 可 以 被 
用 作 后 继 语句 的 参考 变量 。 比 如 , 使 用 a 作为 参考 变量 , 我 们 就 可 以 发 现在 程序 的 结尾 处 。 比 b 
类 1。 

有 3 一 本 节 中 多 次 使 用 的 例子 是 基于 图 9-55 中 显示 的 源 代码 的 。 其 中 的 内 层 循 环 和 外 层 循 


环 是 很 容易 理解 的 ,因为 除了 在 for 人 循环 的 头 部 , f [> aso, 

和 的 值 都 没有 被 改变 。 因 此 有 可 能 把 F 和 &g 替 代 |2) for CE = 100; f < 200; t { 
为 分 别 对 外 层 和 内 层 循环 的 选 代 次数 进行 计数 的 参 “ | 3 

考 变量 i 和 j。 也 就 是 说 , 我 们 可 以 令 f=i+9 Mg 
=j+9, 然后 把 和 8 完全 替换 掉 。 在 翻译 成 中 间 
代码 时 , 我们 可 以 利用 每 个 循环 至 少 会 迭代 一 次 的 
信息 , 把 对 i<100 和 j<10 的 测试 推迟 到 循环 的 尾 
部 进行 = 在 图 9.55 的 代码 中 引入 i 和 j, 并 把 for 循 
环 当 作 repeat 循环 处 理 之 后 , 就 可 以 得 到 如 图 9-56 
中 显示 的 流 图 。 


he ao re ee AS em mca 


< 20; gtt+) { 




































isi 


+ 1 
if i<100 goto B, 





es) S Si sed cn Safa es Reese mp ae Naat 


图 9-56 fil 9. 58 的 流 图 和 它 的 区 域 层 次 结构 


可 以 发 现 , a, b, 和 4 都 是 归纳 变量 。 在 代码 的 每 一 行 上 赋 给 这 些 变量 的 值 的 序列 被 显示 
在 图 9-57 H, RIKAS, 我 们 可 以 找 出 用 参考 变量 i 和 j 表示 的 这 些 变量 的 仿 射 表达 式 。 它 们 
是 , 在 第 4 行 的 a=i, 第 7 行 的 d=10i+j-1 和 第 8 行 的 c=j。 o 
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图 9-57 Pil 9. 58 中 的 各 个 程序 点 上 看 到 的 值 的 序列 


9. 8.2” 数 据 流 问题 的 公式 化 


这 个 分 析 寻 找 关 于 某 些 参 考 变量 的 仿 射 表达 式 。 这 些 参考 变量 包括 (1) 用 于 对 各 个 循环 所 执 


行 的 迭代 进行 计数 的 参考 变量 ，(2) 在 必要 时 存放 区 域 和 人口 处 的 值 的 参考 变量 。 这 个 分 析 也 可 以 


找到 归纳 变量 、 循环 不 变 表 达 式 以 及 常量 。 这 里 常量 可 以 看 作 是 仿 射 表达 式 的 退化 情况 。 请 注 


意 , 这 个 分 析 不 能 够 找到 所 有 的 常量 , 因为 它 只 跟踪 参考 变量 的 表达 式 。 


数据 流 值 : 符号 化 映射 


这 个 分 析 使 用 的 数据 流 值 的 域 是 符号 化 映射 ， 它 是 将 程序 中 的 变量 映射 到 值 的 函数 。 这 个 


值 可 以 是 一 个 参考 值 的 仿 射 函数 或 者 表示 非 仿 射 表达 式 的 特殊 符号 NAA。 如 果 只 有 一 个 变量 ， 


那么 相应 半 格 的 底 元 素 值 就 是 一 个 把 该 变量 映射 为 NAA 的 映射 。n 个 变量 的 半 格 就 是 各 个 变量 
的 半 格 的 积 。 我 们 使 用 mNAA 来 表示 这 个 半 格 的 底 元 素 , 它 把 所 有 变量 都 映射 为 NAA。 就 像 在 常 
量 传播 中 所 做 的 那样 , 我 们 可 以 把 顶层 数据 流 值 定义 为 把 所 有 变量 都 映射 为 一 个 未 知 值 的 符号 


化 映射 。 但 是, 在 基于 区 域 的 分 析 中 我 们 不 需要 顶 元 素 的 值 。 


图 9-58 显示 了 例 9. 58 的 代码 中 和 各 
个 基本 块 关联 的 符号 化 映射 。 我 们 将 在 稍 后 看 到 
如 何 发 现 这 些 映 射 , 它们 是 在 图 9-56 的 流 图 上 进 
行 基于 区 域 的 数据 流 分 析 的 结果 。 

和 程序 入 口 相关 联 的 符号 化 映射 是 mNAA。 
在 Bi WHOA, a 的 值 被 设置 为 0。 Æ B, 的 人 
口 处 , 在 第 一 次 迭代 时 a 的 值 是 0, 然后 在 每 一 
次 外 层 循环 的 迭代 中 都 增加 一 。 因 此 , 在 进入 第 
i 次 迭代 时 其 值 为 i-1, 在 迭代 结束 时 为 i。 因 为 
AE b, c, d 在 外 层 循环 人 口 处 的 值 未 知 ,， 所 以 
Æ B, 入 口 处 的 符号 化 映射 把 5、c、d 映射 到 
NAA。 到 现在 为 止 , 它们 的 值 依赖 于 外 层 循环 的 
迭代 次 数 。 在 B, 出 口 处 的 符号 化 映射 反映 了 该 
基本 块 中 对 a、b 和 < 赋值 的 语句 的 运行 效果 。 其 
他 的 符号 化 映射 可 以 用 类 似 的 方法 推导 得 到 。 一 
且 我 们 确认 图 9-58 中 的 映射 是 有 效 的 , 就 可 以 把 
图 9-55 PX} a, b, c Ald 的 赋值 替换 为 适当 的 仿 
射 表达 式 。 也 就 是 说 , 我 们 可 以 把 图 9-55 EA 
图 9-59 中 的 代码 。 

单个 语句 的 传递 函数 


这 个 数据 流 问 题 中 的 传递 函数 根据 符号 化 映射 计算 得 到 新 的 符号 化 映射 。 为 了 计算 一 个 赋 





例 9.58 中 的 程序 的 符号 化 映射 


2) for (i = 1; i <= 100; i++) { 
i; 
10*i; 

0; 

(j = 1; j <= 10; j++) { 
d = 10*i + j -1; 

cS jg 


or 





图 9-59 将 图 9-55 的 代码 中 的 赋值 语句 替换 为 
关于 参考 变量 i 和 j 的 仿 射 表达 式 之 后 的 代码 


O 


值 语句 的 传递 函数 , 我 们 解释 该 语句 的 语义 , 并 决定 被 赋值 的 变量 能 否 被 表示 为 赋值 语句 右边 的 
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值 的 仿 射 表达 式 。 所 有 其 他 变量 的 值 保持 不 变 。 
一 个 语句 s 的 传递 函数 记 为 大 ,其 定义 如 下 : 
1) 如 果 * 不 是 一 个 赋值 语句 , WAS 就 是 一 个 单元 函数 。 
2) 如 果 's 是 一 个 对 % 赋值 的 语句 , 那么 


m(v) XY BTA ABEL v Ax 
co teym(y) +ezm(z) 如 果 x 被 赋值 为 co + cly + ezz, 
f,(m) (x) = (c, =0, 或 者 m(y) ANAA), FFA 
(cs =0, Be m(z) ANAA) 
NAA 否则 


其 中 表达 式 co + cim(y) + cm(z) 用 来 表示 所 有 可 能 出 现在 对 x* 赋值 的 语句 的 右 部 、 关 于 变量 7 
和 z 的 各 种 形式 的 表达 式 。 这 些 表 达 式 向 % 赋予 的 值 是 变量 之 前 的 值 的 一 次 仿 射 变换 的 结果 。 这 
些 表 达 式 是 cu ,co +Y, co -y, Y+z, x-y, cı *y》 和 yA/(1/c1)。 请 注意 , 在 很 多 情况 下 , cos cl 和 
o 中 的 一 个 或 者 多 个 的 值 为 0。 

UJ 如果 该 赋值 语 句 是 x =y +2, 那么 co =0 而 cl = c =1。 如 果 该 赋值 表达 式 是 x =y/5， 
WA ty =c = OM c, = 1/5. G 


r 





关于 值 映射 上 的 传递 函数 的 注意 事项 

我 们 定义 符号 化 映射 上 的 传递 函数 的 方法 中 有 一 个 微妙 之 处 , 即 可 以 选择 不 同 的 方式 来 
表示 一 个 计算 的 效果 。 如 果 m 是 一 个 传递 函数 的 输入 映射 ,那么 m(%) 实 际 上 表示 的 是 “变量 
x 在 入 口 处 可 能 具有 的 任何 值 ”。 我 们 努力 尝试 把 该 传递 函数 的 结果 表示 为 输入 映射 中 用 到 
的 参考 变量 的 仿 射 表达 式 。 

Hg TRAE fm) (x) 这 样 的 表达 式 的 正确 解释 , 其 中 f 是 一 个 传递 函数 , m 是 一 个 映 
St, 而 * 是 一 个 变量 。 按 照 数学 上 的 约定 , 我们 从 左边 开始 应 用 函数 , 也 就 是 说 我 们 首先 计算 
fm), 结果 是 一 个 映射 。 因 为 映射 也 是 函数 , 随后 我 们 可 以 把 它 应 用 于 一 个 变量 x 并 得 到 一 
个 值 。 














传递 函数 的 组 合 

Af, 和 所 是 两 个 以 其 输入 映射 严 来 定义 的 传递 函数 。 为 了 计算 户 。 矿 ,我们 把 万 的 定义 中 
的 m(0;) 的 值 蔡 换 为 万 (m) (v;) 的 定义 。 我 们 把 所 有 对 NAA 的 运算 都 替换 为 NAA。 也 就 是 : 

1) 如 果 户 (mm)(o) =NAA, BBA (f° f,) (m) (v) =NAA。 

2) Mf (m) (vr) =co + Ljexm(v;), BA 

NAA WENT FE i140, c; 40 Af, (m)(v;) =NAA 

Ce fm) fs repens = 
HEEJ 多 9 58 中 的 各 个 基本 块 的 传递 函数 可 以 通过 把 组 成 它们 的 语句 的 传递 函数 组 合 起 来 
计算 得 到 。 这 些 传递 函数 在 图 9-60 中 定义 。 口 

数据 流 问 题 的 解决 方法 

我 们 使 用 IN, ;[ By ] 和 OUT; ;[ B3] 来 表示 在 内 层 循环 的 第 /次 迁 代 和 外 层 循环 的 第 之 次 迭代 
时 基本 块 B; 的 输入 和 输出 数据 流 值 。 对 于 其 他 的 基本 块 , 我 们 使 用 IN;[ Bi ] 和 0UT,[ Bi ] 来 表示 
在 外 层 循环 的 第 ;次 适 代 时 的 相应 数据 流 值 。 我 们 还 可 以 看 到 ,图 9-58 中 显示 的 符号 化 映射 满 
足 传递 函数 给 出 的 约束 。 这 些 约束 在 图 9-61 中 列 出 。 
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ouT[Bx] fe (in[Bx)), 对 所 有 的 Bk 











flm)(a) | f(m)(b) [ f(m)(e) | fm) ouT[Bi] > IN1[B2] 
0 m(b) m(c) m(d) OUTi[B?] = IN; [B3], =i S10 
fp, | m(a) +1 | 10m(a) + 10 | 0 m(d) OUT; j-1[B3] > INig(Bs],  1<%<100,2<7< 10 
fp, | m(a) m/(b) m(c) +1 | m(b) + m(c) OUT: 10[B3] > INi[Bal, 2<i <100 
fz, | mla) m(b) m(c) m(d) OuT; 1[Bs] > INi[B2]; 1<i<100 
图 9-60 例 9.58 的 传递 函数 图 9-61 BEHARRAREN EAR 


第 一 个 约束 说 明 , 一 个 基本 块 的 输出 映射 是 通过 把 基本 块 的 传递 函数 应 用 到 输入 映射 上 而 
得 到 的 。 其 余 的 约束 说 明 , 在 程序 执行 的 时 候 , 一 个 基本 块 的 输出 映射 必须 大 于 或 等 于 后 继 基 本 
块 的 输入 映射 。 

请 注意 , 我 们 的 迁 代 数据 流 算法 不 能 给 出 上 面 的 解 ,因为 它 无 法 用 已 执行 的 迭代 次 数 来 表达 
数据 流 值 。 正 如 我 们 将 在 下 一 节 看 到 的 ; 可 以 用 基于 区 域 的 分 析 来 找 出 这 样 的 解 。 
9. 8. 3， 基 于 区 域 的 符号 化 分 析 

我 们 可 以 把 9.7 节 中 描述 的 基于 区 域 的 分 析 技 术 进 行 扩展 , 用 以 寻找 一 个 循环 的 第 i 次 迭代 
中 各 个 变量 的 表达 式 。 和 其 他 基于 区 域 的 算法 一 样 ， 一 个 基于 区 域 的 符号 化 分 析 也 有 一 个 自 底 
向 上 的 处 理 过程 和 一 个 自 项 向 下 的 处 理 过 程 。 这 个 自 底 向 上 的 处 理 过 程 用 一 个 传递 函数 来 概括 
一 个 区 域 的 执行 效果 。 这 个 传递 函数 把 人 口 处 的 符号 化 映射 转变 为 出 口 处 的 输出 符号 化 映射 。 
在 自 项 向 下 的 处 理 过 程 中 , 符号 化 映射 的 值 被 向 下 传播 到 内 层 区 域 。 

不 同 之 处 在 于 我 们 处 理 循环 的 方法 。 在 9.7 节 , 循环 的 效果 是 用 闭 包 运算 来 概括 的 。 
给 定 一 个 其 循环 体 传递 函数 为 了 的 循环 , 的 闭 包 f* 被 定义 为 在 任意 多 次 应 用 /可 能 产生 的 
所 有 效果 之 上 无 穷 多 次 应 用 交汇 运算 而 得 到 的 结果 。 但 是 , 为 了 找到 一 个 归纳 变量 , 我们 
需要 确定 一 个 变量 的 值 是 否 为 至 今 已 执行 的 迭代 次 数 的 仿 射 函 数 。 相 应 的 符号 化 映射 必须 
把 正在 执行 的 迭代 的 序号 作为 参数 ， 不 仅 如 此 ， 只 要 我 们 知道 一 个 循环 执行 迭代 的 总 次 数 ， 
就 可 以 使 用 这 个 数字 来 找到 循环 之 后 归纳 变量 的 值 。 比 如 , 在 例 9. 58 中 我 们 断定 在 执行 了 
第 i 次 迭代 之 后 , a WEE i 因为 循环 共有 100 次 迭代 , 在 循环 结束 的 时 候 &a 的 值 一 定 
是 100。 

接 下 来 ,我们 首先 定义 基本 运算 符 : 用 于 符号 化 分 析 的 传递 函数 的 交汇 运算 和 组 合 运算 。 然 
后 说 明 如 何 使 用 它们 进行 基于 区 域 的 归纳 变量 分 析 。 

传递 函数 的 交汇 运算 

当 计 算 两 个 函数 的 交 时 ,除非 两 个 函数 把 一 个 变量 映射 成 为 同一 个 不 是 NAA 的 值 , 这 个 变 


量 的 值 就 是 NAA。 因 此 
Lo as afo 2 f(m)(v) 

带 参数 的 函数 组 合 

为 了 把 一 个 变量 表示 成 为 一 个 关于 循环 下 标的 仿 射 函数 , 我 们 要 计算 出 将 某 个 函数 组 合 给 
定 多 次 后 的 效果 。 如 果 一 次 迭代 的 效果 可 以 用 一 个 传递 函数 /概括 , 那么 对 某 个 i SO, 执行 i 次 
迭代 的 效果 记 为 fi。 请 注意 , 当 i=0 时, f =f" =7T 是 一 个 单元 函数 。 

程序 中 的 变量 可 以 分 成 四 种 类 型 : 

1) WE fm) (x) =m(x) +e, 其 中 < 是 一 个 常数 ; 那么 对 于 所 有 的 i0,f'(m) (x) =m(x) 
+ cig 如 果 一 个 循环 的 循环 体 可 以 用 传递 函数 表示 , 我 们 说 * 是 这 个 循环 的 一 个 基本 归纳 变量 


(basic induction variable) 。 
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2) tM fm) (x) =m(%) ,那么 对 于 所 有 的 i 之 0, f(m) (x) =m(%)。 变 量 x* 没 有 被 改变 。 
如 果 循 环 的 循环 体 具有 传递 函数 /, 那么 x 的 值 在 循环 的 任意 多 次 迭代 结束 之 后 依然 保持 不 变 。 
我 们 说 * 是 该 循环 的 符号 化 常量 (symbolic constant) o 
3) MEME) =60 tama) +--+, m(x,), 其 中 每 个 如 要 图 是 基本 归纳 变量 , 要 么 是 
符号 化 常量 , 那么 对 于 i>0, 有 
fim) (x) =co +e fi(m) (a) H+ enfi (m) (a) 
我 们 说 * 虽然 不 是 基本 归纳 变量 , 但 它 依然 是 一 个 归纳 变量 。 请 注意 , 上 述 公式 对 于 i=0 不 
成 立 。 
4) 在 其 他 情况 下 ,fi(m) (x) =NAA。 
要 得 到 执行 固定 多 次 兴 代 的 效果 , 我 们 只 需要 把 上 面 的 i PP GRUB AT. 当 和 迭代 
次 数 未 知 时 ,在 最 后 一 次 迭代 开始 时 变量 的 值 由 /* 给 出 。 在 这 种 情况 下 , 其 值 仍 然 可 以 用 仿 射 
函数 表示 的 变量 只 有 那些 循环 不 变 变量 。 
: m(v) ”如 果 f(m)(v) =m(v) 
f* (m) (2) = {NAA og 
UAA 11719. 58 的 最 内 层 循环 , 执行 i(i > 0) KRR ERR S, MR. RA fa, 
的 定义 ,我 们 看 到 a AD 是 符号 化 常量 。 因 为 。 HERVE RI, 所 以 它 是 一 个 基本 归纳 变 
E, KA d 是 符号 化 常量 5 和 基本 归纳 变量 < 的 仿 射 函数 , 所 以 它 是 一 个 归纳 变量 。 由 此 可 得 : 


m(a) ane v=a 

: © m(b) One v =b 
fa, Cm) (0) = m(c) +i WMR v =c 
m(b)+m(c)+i 如果 v=d 





如 果 我 们 不 能 指出 基本 抉 B; 的 循环 兴 代 了 多 少 次 , 那么 就 不 能 使 用 f', 而 必须 使 用 /* 来 表示 在 
循环 结束 时 的 条 件 。 此 时 我 们 有 
m(a) MURR v =a 
i m(b)  WMv=b 
sl eh 
NAA 如 果 v=d g 
一 个 基于 区 域 的 算法 
基于 区 域 的 符号 化 分 析 。 
输入 : 一 个 可 归 约 的 流 图 Co 
输出 : C 的 每 个 基本 块 8 的 符号 化 映射 IN[B]。 
方法 : 我 们 对 算法 9. 53 做 出 如 下 的 修改 。 
1) 我 们 改变 了 为 一 个 循环 区 域 构造 传递 函数 的 方法 。 在 原来 的 算法 中 , 我 们 使 用 传递 函数 
Fr mts] 来 把 循环 区 域 尺 入口 处 的 符号 化 映射 变换 为 经 过 未 知 多 次 迭代 之 后 位 于 循环 体 S 的 入 口 
处 的 符号 化 映射 。 如 图 9-50b 所 示 , 这 个 函数 被 定义 为 代表 了 所 有 回 到 循环 人 口 处 的 路 径 的 传递 
函数 的 闭 包 。 在 这 里 , 我们 定义 fk, i ints] 来 表示 从 循环 区 域 人 口 处 开始 直到 第 i 次 迭代 的 入 口 
处 的 执行 效果 。 因 此 ， 


r = ( i-] 
fr, i, Ints] eis at s, OUTLB] ) 


2) 如 果 一 个 区 域 的 迭代 次 数 已 知 , 该 区 域 的 执行 效果 的 描述 是 把 上 面 定义 中 的 i 将 换 为 实 
IEE 
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3) 在 算法 的 自 项 向 下 处 理 过 程 中 , 我 们 计算 fr,;, Iwrs] 就 可 以 找 出 与 一 个 循环 的 第 i 次 迭代 


的 人 口 处 相关 的 符号 化 映射 。 


4) 如 果 一 个 变量 的 输入 值 m(2) 被 区 域 尺 中 的 某 个 符号 化 映射 的 右 部 使 用 , 并 且 在 该 区 域 的 
入 口 处 m(v) = NAA, 则 我 们 引入 一 个 新 的 参考 变量 i, 在 区 域 刃 的 开始 处 加 上 赋值 语句 t =v, 并 


且 所 有 对 m(v) 的 引用 都 被 蔡 换 为 :。 如 果 我 们 不 在 
这 个 点 上 引入 一 个 参考 变量 , 那么 4 的 取 值 NAA 将 
被 传递 到 内 层 循环 。 Oo 
对 于 例 9. 58, 我 们 在 图 9-62 中 显示 了 该 
程序 的 传递 函数 是 如 何在 算法 的 自 底 向 上 处 理 过 程 
中 被 计算 出 来 的 。 区 域 Rs 是 内 层 循环 , 它 的 循环 体 
是 B;。 表 示 从 区 域 Rs 的 入口 处 到 达 第 jj> 1) 次 适 
代 开 始 处 的 路 径 的 传递 函数 是 应” ; 表示 到 达 第 次 


和 迭代 结尾 处 的 路 径 的 传递 函数 是 户 , o 

区 域 Re 由 基本 块 B 和 B4 以 及 它们 之 间 的 循 
HKH R; 组 成 。 从 B, 和 Rs 的 入 口 处 开始 的 传递 
函数 可 以 用 原 算法 中 的 同样 方法 来 计算 。 因 为 f8, 是 
一 个 单元 函数 ， 所 以 传递 函数 ff our[rs,] 表 示 了 基 
本 块 B 和 整个 内 层 循环 的 执行 效果 的 组 合 。 因 为 


fRs,j,OUTIBs] 


frizout) = 





jot 
Bs 


Sb, 


Frs,j,IN[Bs]_ = 


fRe,IN[B;] L 
Sing IN[Rs] fez 
fRe,OUTIB4] To fRs10,0UT[Bs] o SB. 


fR1i,IN[Re] = fie, OUTIB,] 7 


fhe OUTIS: 
fRa,IN[B1] I 


Íra IN[R:) fsı 
fre ,OUT[Ba] fR7,100,0UTIB4] o fB1 


图 9-62 例 9.58 的 自 底 向 上 处 理 
过 程 中 的 传递 函数 的 关系 


已 知 内 层 循环 将 迭代 10 次 , 所 以 我 们 可 以 把 j 替换 为 10 来 精确 描述 内 层 循环 的 执行 效果 。 其 余 
的 传递 函数 可 以 用 类 似 的 方式 计算 得 到 。 计 算得 到 的 实际 传递 函数 显示 在 图 9-63 H, 




















m(b) 
m(b) 


J Rs j, IN{B3] 
Frs,j,OUT(Bs] 













NAA 
m(b) +m(c)+ 










m/(b) 
10m(a) + 10 
10m(a) + 10 


Fg IN{B2] 
Fig IN{Rs] 
fre, OUT[Bs 

































m(a)+i-—1 
m(a)+% 


NAA 
10m(a) + 10i 


Fz iIN[Ro] 
fR1,i,0UT[B4] 








fRs,IN[B1] 
Rg,IN[R7] 0 
Rs,OUTIBa] 













10m(a) +9 
NAA 

10m(a)+ 
101+ 9 











图 9-63 在 例 9.58 的 自 底 向 上 处 理 过 程 中 计算 得 到 的 传递 函数 


在 程序 人 口 处 的 符号 化 映射 就 是 mwaa。 我 们 使 用 自 顶 向 下 处 理 过 程 来 计算 到 达 逐 层 咎 套 的 
区 域 的 入口 处 的 符号 化 映射 , 直到 我 们 得 到 了 所 有 基本 块 的 符号 化 映射 为 止 。 一 开始 的 时 候 我 


们 首先 计算 区 域 R 中 的 基本 块 Bi 的 数据 流 值 : 


IN[ By ] =myaa 
OUT[ B; ] = 户 (IN[B, }) 


再 向 下 到 达 区 域 Rj 和 Re , 我 们 得 到 


IN; | B3] =fr, i, npr] (OUTIL B; |) 
OUT; [ By ] =j (IN;[ By] ) 


最 后 , 在 区 域 Rs 中 我 们 得 到 
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IN; ;[B3] =fr, j, mtB,] (OUT: [B,]) 
OUT,, j[ Bs] =f», CIN;, j Bs 1) 
毫 不 奇怪 ， 这 些 等 式 产生 的 就 是 我 们 在 图 9-58 中 显示 的 结果 。 a 
例 9.58 显示 了 一 个 简单 的 程序 , 其 中 的 各 个 符号 ts een aay 
化 映射 中 的 每 个 变量 都 有 一 个 仿 射 表达 式 。 我 们 使 用 a = input(); 


for (j = 1; TES j#+) d 


fi) 9. 65 来 说 明 为 什么 以 及 如 何在 算法 9.63 中 引入 参 
考 变 量 。 j 
DAA 考虑 图 9-64a 中 的 简单 例子 。 令 方 为 描述 
内 层 循环 迭代 7 次 的 执行 效果 的 传递 函数 。 即 使 " 的 
值 可 能 在 该 循环 的 执行 中 上 下 变动 , 我 们 看 到 8 是 一 a) 变量 a 在 其 中 上 下 变动 的 一 个 循环 
个 基于 a 在 此 循环 的 人 口 处 的 取 值 的 归纳 变量 。 也 就 e 
是 说 , f(m) (5) =m(a) -1+j。 因 为 a 被 赋予 了 一 个 (Bie sie 

输入 值 , 所 以 在 内 层 循环 人口 处 的 符号 化 映射 把 a BR for (j = 1; j < 10; j++) { 
射 为 NAA。 我 们 在 该 人 口 处 引入 一 个 新 的 参考 变量 Canes 


Shoo ib + 

来 保存 a 的 值 , 并 像 图 9-64b 中 那样 进行 替换 。 =O a i 
9.8.4 9.8 节 的 练习 Ae 

练习 9. 8, 1: 对 于 图 9-10 中 的 流 图 ( 见 9. TBI yy 参考 变量 7 使 得 成 为 一 个 归纳 变量 
3), 给 出 下 列 基本 块 的 传递 函数 。 

1) 基本 块 B,。 

2) 基本 块 B4。 

3) 基本 块 B;。 

练习 9. 8.2: 考虑 图 9-10 中 由 基本 块 B3 和 Bs 组 成 的 内 层 循环 。 如 果 ; 表示 了 该 循环 的 迭代 
执行 次 数 , 而 /是 从 该 循环 的 人 口 ( 即 B, 的 开始 处 ) 到 B4 的 出 口 处 的 循环 体 ( 即 不 包含 B, 到 B, 
的 边 ) 的 传递 函数 , 那么 是 什么 ? 请 记 住 , f 把 一 个 映射 m 作为 参数 , 而 mn 给 变量 a、b、d、e 中 
的 每 一 个 赋予 一 个 值 。 虽 然 我 们 不 知道 这 些 变量 的 值 , 但 是 我 们 用 m(a) 等 来 表示 它们 。 

| 练习 9. 8.3: 现在 考虑 图 9-10 中 由 BL. B3, By. Bs 组 成 的 外 层 循 环 。 令 g 为 循环 的 入 口 
处 B, 到 它 的 出 口 处 Bs 的 循环 体 的 传递 函数 。 令 i 表示 由 B 和 By 组 成 的 内 层 循环 的 迭代 次 数 
(我 们 无 法 知道 迭代 的 具体 次 数 )， 并 令 7/ 表示 外 层 循环 的 迭代 次 数 (我 们 还 是 无 法 知道 迭代 的 有 具 
体 次 数 ) 。 那 么 g 是 什么 ? 
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全 局 公共 子 表达 式 : 一 个 重要 的 优化 方法 是 寻找 同一 个 表达 式 在 两 个 不 同 基 本 块 中 的 计 
算 过 程 。 如 果 一 个 在 男 一 个 前 面 , 我 们 可 以 把 第 一 次 计算 该 表达 式 时 得 到 的 结果 存放 起 
K, 并 在 再 次 计算 该 表达 式 时 使 用 这 个 结果 。 

复制 传播 : 一 个 复制 语 名 =v 把 一 个 变量 wv 赋值 给 男 一 个 变量 ww 在 有 些 情况 下 , 我 们 可 
以 把 所 有 对 的 使 用 替换 为 对 4 的 使 用 , 从 而 消除 这 个 赋值 语句 以 及 变量 wo 

代码 移动 : 另 一 种 优化 方法 是 把 一 个 计算 过 程 移动 到 它 所 在 的 循环 之 外 。 只 有 当 循 环 的 
每 次 迭代 中 这 个 计算 过 程 都 生成 同样 的 值 , 这 种 改变 才 是 正确 的 。 

归纳 变量 : 很 多 循环 都 有 归纳 变量 。 这 些 变 量 在 循环 执行 时 的 不 同 迭 代 中 的 取 值 是 一 个 
线性 序列 。 有 些 归纳 变量 仅仅 用 于 对 和 迭代 进行 计数 ,它们 经 常 可 以 被 消除 ， 从 而 降低 了 








图 9-64” 引 入 参考 变量 的 需求 
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a 





循环 的 一 次 迭代 所 需要 的 时 间 。 

数据 流 分 析 : 一 个 数据 流 分 析 模式 在 程序 的 每 个 点 上 都 定义 了 一 个 值 。 程 序 的 各 个 语句 
都 有 相关 联 的 传递 函数 。 这 些 函 数 给 出 了 一 个 语句 之 前 和 之 后 的 数据 流 值 之 间 的 关系 。 
具有 多 个 前 驱 的 语句 的 值 是 它 的 各 个 前 驱 的 值 的 组 合 。 这 个 组 合 通 过 交汇 (或 者 说 汇流 ) 
函数 计算 得 到 。 

基本 块 的 数据 流 分析 : 因为 数据 流 值 在 一 个 基本 块 内 的 传播 过 程 通常 很 简单 , 所 以 数据 
流 方程 通常 给 每 个 基本 块 设置 两 个 值 , 称 为 IN 值 和 OUT 值 。 这 两 个 值 分 别 表示 该 基本 
块 在 开始 处 和 结尾 处 的 数据 流 值 。 把 基本 块 中 各 个 语句 的 传递 函数 组 合 起 来 就 可 以 得 到 
代表 整个 基本 块 的 传递 函数 。 

到 达 定 值 : 到 达 定 值 数据 流 框架 的 数据 流 值 是 程序 中 的 语句 的 集合 。 这 些 语句 给 一 个 或 者 
多 个 变量 定 值 。 如 果 一 个 变量 肯定 在 一 个 基本 块 内 被 重新 定 值 , 那么 该 基本 块 的 传递 函数 
杀 死 了 对 这 个 变量 的 定 值 , 同时 它 还 加 入 (“生成 ”) 了 在 该 模块 中 发 生 的 对 变量 的 定 值 。 只 
要 一 个 定 值 到 达 某 个 点 的 任意 一 个 前 驱 , 它 就 到 达 了 该 点 , 因此 交汇 运算 是 并 集运 算 。 

活跃 变量 ; 另 一 个 重要 的 数据 流 框架 计算 了 在 各 个 程序 点 上 活跃 的 (将 在 重新 定 值 之 前 补 
使 用 的 ) 变 量 。 这 个 框架 和 到 达 定 值 框 架 类 似 , 但 是 传递 函数 是 逆向 传递 数据 流 值 的。 一 
个 变量 在 某 个 基本 块 的 开始 处 活跃 的 条 件 是 ,要 么 在 该 基本 块 中 它 在 定 值 之 前 就 被 使 用 ， 
要 么 该 基本 块 中 没有 对 它 重 新 定 值 且 它 在 该 基本 块 结尾 处 活跃 。 

可 用 表达 式 ; 为 了 寻找 全 局 公共 子 表达 式 , 我 们 要 确定 各 个 程序 点 上 的 可 用 表达 式 。 所 
谓 可 用 表达 式 就 是 之 前 已 经 计算 过 , 且 在 最 后 一 次 计算 之 后 它 的 运算 分 量 部 没有 被 重新 
定 值 的 表达 式 。 这 个 问题 的 数据 流 框架 和 到 达 定 值 框 架 类 似 , 但 是 其 交汇 运算 是 交集 运 
算 , 而 不 是 并 集运 算 。 

数据 流 问 题 的 抽象 : 常见 的 数据 流 问题 ,比如 前 面 提 到 过 的 那些 , 都 可 以 用 一 个 通用 的 数 
学 结构 表达 。 数 据 流 值 是 一 个 半 格 的 成 员 , 这 个 半 格 的 交汇 运算 就 是 数据 流 问 题 的 交汇 
(汇流 ) 函数 。 传 递 函 数 把 半 格 元 素 映 射 到 半 格 元 素 。 要 求 传递 函数 的 集合 必须 对 于 组 合 
运算 封闭 , 并 且 包 含 单元 函数 。 

单调 框架 : 每 个 半 格 都 有 一 个 < 关系 a<b 当 且 仅 当 a 和 b=a。 单 调 框架 具有 以 下 性 质 : 
每 个 传递 函数 都 保持 了 三 关系 。 也 就 是 说 ,对 于 任意 的 格 元 素 " Mb URE AHS, 
a<b Ha T fla) <f(b). 

可 分 配 框架 : 这 种 框架 满足 下 面 的 条 件 : 对 于 所 有 的 格 元 素 Alb 以 及 传递 函数 f, fa N 
b) =f(a) 和 f(b)。 可 以 证 明 可 分 配 框架 的 条 件 蕴含 了 单调 框架 的 条 件 。 

Fo RAR RAE. 所 有 的 单调 数据 流 框架 可 以 通过 一 个 迭代 算法 来 解决 。 在 这 个 解 
法 中 , 首先 (按照 不 同 的 框架 ) 适 当地 初始 化 各 个 基本 块 的 IN 和 OUT 值 , 然后 应 用 传递 
函数 和 交汇 运算 不 断 地 计算 这 些 变量 的 新 值 。 这 个 解法 总 是 安全 的 ( 即 按照 它 的 解 对 程 
序 进行 优化 不 会 改变 程序 所 做 的 计算 )。 但 是 只 有 当 框 架 是 可 分 配 的 时 , 这 个 解 才 一 定 是 
可 能 的 解 中 最 好 的 。 

常量 传播 框架 : 虽然 诸如 到 达 定 值 这 类 的 基本 框架 都 是 可 分 配 的 , 但 存在 一 些 单调 但 不 
可 分 配 的 框架 。 这 类 框架 中 的 一 个 例子 是 关于 常量 传播 的 。 在 常量 传播 框架 使 用 的 半 格 
H, 格 元 素 是 从 程序 变量 到 常量 以 及 两 个 特殊 值 的 映射 。 这 两 个 特殊 值 分 别 代表 “无 信 
息 ” 和 "一定 不 是 常量 "。 

部 分 宛 余 消除 : 很 多 有 用 的 优化 ， 比 如 代码 移动 和 全 局 公共 子 表 达 式 消除 , 可 以 被 扩展 为 同 
一 个 问题 。 该 问题 称 为 部 分 元 余 消 除 。 如 果 在 某 个 点 上 需要 计算 一 个 表达 式 , 但 是 这 个 表 
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达 式 只 在 到 达 这 个 点 的 部 分 路 径 上 可 用 , 那么 我 们 可 以 只 在 该 表达 式 不 可 用 的 路 径 上 进行 
计算 。 正 确 地 应 用 这 个 想法 要 求解 决 四 个 不 同 的 数据 流 问 题 , 并 做 一 些 其 他 的 操作 。 

支配 结 点 : 如 果 在 一 个 流 图 中 所 有 到 达 某 结 点 的 路 径 都 必须 经 过 另 二 个 结 点 ,那么 后 一 
个 结 点 就 支配 前 一 个 结 点 。 一 个 真 支配 结 点 是 不 同 于 被 支配 结 点 的 支配 结 点 。 除 了 入 口 
结 点 , 每 个 结 点 都 有 一 个 直接 支配 结 点 一 被 该 结 点 的 所 有 其 他 真 支配 结 点 所 支配 的 真 
支配 结 点 。 

流 图 的 深度 优先 排序 : 如 果 我 们 从 一 个 流 图 的 入口 结 点 开始 对 它 进 行 深度 优先 搜索 , 我 
们 会 得 到 一 个 深度 优先 生成 树 。 结 点 的 深度 优先 排序 是 这 棵 树 的 后 序 遍 历次 序 的 北 序 。 
边 的 分 类 : 当 我 们 构造 一 个 深度 优先 生成 树 之 后 ， 相应 流 图 的 全 部 边 可 以 分 成 三 大 类 ; 前 
进 边 ( 即 从 祖先 结 点 到 真 后 代 结 点 的 边 ) 、 后 退 边 ( 即 从 后 代 结 点 到 祖先 结 点 的 边 ) 和 交叉 
边 (其 他 ) 。 生成 树 的 一 个 重要 性 质 是 所 有 的 交叉 边 都 是 从 树 的 右边 到 达 左 边 。 ATS 
要 人 性质 是 在 这 些 边 中 , 如果 按照 深度 优先 排序 ( 即 后 序 次 序 的 逆序 ) ， 只 有 后 退 边 的 头 比 
它 的 尾 的 排序 更 靠 前 。 

回 边 ; 回 边 就 是 其 头 结 点 支配 尾 结 点 的 边 。 不 管 选择 流 图 的 哪 一 棵 深度 优先 生成 树 ,每 
条 回 边 都 是 一 条 后 退 边 。 

TARA: 如 果 不 管 选择 哪个 深度 优先 生成 树 , 该 树 的 每 个 后 退 边 都 是 一 条 回 边 , 那么 
这 个 流 图 就 是 可 归 约 的 。 绝 大 部 分 流 图 都 是 可 归 约 的 ， 控制 流 语句 都 是 通常 的 循环 和 分 
支 语 句 的 程序 的 流 图 一 定 是 可 归 约 的 。 

自然 循环 : 一 个 自然 循环 是 一 个 结 点 的 集合 。 集合 中 有 一 个 头 结 点 ,， 它 支配 了 该 集合 中 
的 所 有 其 他 结 点 , 并 且 至 少 有 一 条 回 边 进入 这 个 头 结 点 。 给 定 任 意 的 回 边 , 我 们 可 以 构 
造 出 它 的 自然 循环 。 循 环 中 包括 回 边 的 头 结 点 ， 以 及 所 有 不 经 过 头 结 点 就 能 够 到 达 此 回 
边 的 尾 结 点 的 其 他 结 点 。 两 个 具有 不 同 头 结 点 的 自然 循环 要 么 互 不 相交 , 要 么 一 个 循环 
完全 包含 在 另 一 个 循环 里 面 。 这 个 性 质 使 得 我 们 可 以 讨论 媒 套 循环 的 层次 结构 , 前 提 是 
“循环 " 指 的 是 自然 循环 。 

深度 优先 排序 提高 了 迁 代 算法 的 效率 ; 如 果 沿 着 无 环 路 径 传播 信息 足以 得 到 正确 结果 ， 
即 环 路 不 会 增加 信息 ， 那么 相应 的 迭代 算法 只 需要 很 少 几 次 迭代 就 可 以 得 到 正确 结果 。 
如 果 我 们 按照 深度 优先 顺序 访问 结 点 , 那么 任何 向 前 传递 信息 的 数据 流 框架 ( 比如 到 达 定 
值 ) 都 可 以 在 确定 次 数 内 收敛 。 收敛 次 数 不 大 于 所 有 无 环 路 径 中 的 后 退 边 的 最 大 个 数 加 
上 2。 如果 我 们 用 深度 优先 顺序 的 逆序 ( 即 后 序 次 序 ) 访 问 结 点 ， 上 面 的 结论 对 于 逆向 传 
播 的 框架 ( 比如 活跃 变量 ) 也 成 立 。 

BR: 区 域 是 一 个 结 点 和 边 的 集合 。 区 域 中 有 一 个 头 结 点 支配 了 其 中 的 所 有 结 点 。 除 
了 之 外 ,区域 中 所 有 结 点 的 前 驱 必须 也 在 此 区 域 中 。 区 域 的 边 集 包 含 了 区 域 中 的 任意 
两 个 结 点 之 间 的 边 ， 但 是 可 能 不 包含 某 些 或 所 有 到 达 头 结 点 的 边 。 

区 域 和 可 归 约 流 图 :可 归 约 流 图 可 以 被 扫描 分 析 成 为 一 个 由 区 域 组 成 的 层次 结构 。 这 些 
区 域 要 么 是 循环 区 域 , 要 么 是 循环 体 区 域 。 循环 区 域 包 含 了 所 有 进入 头 结 点 的 边 , 而 循 
环 体 区 域 不 包含 到 达 头 结 点 的 边 。 

基于 区 域 的 数据 流 分 析 : 不 同 于 迭代 方法 的 另 一 种 数据 流 分 析 方 法 是 沿 着 区 域 层次 结构 
向 上 然后 再 向 下 扫描 ， 计算 从 各 个 区 域 的 头 到 达 该 区 域 中 各 个 结 点 的 传递 函数 

基于 区 域 的 归纳 变量 检测 : 基于 区 域 的 分 析 技术 的 重要 应 用 之 一 是 用 以 寻找 归纳 变量 的 
数据 流 框架 。 该 框架 试图 找 出 循环 区 域 中 每 个 满足 下 面条 件 的 变量 的 公式 - 这 些 变量 的 
值 可 表示 为 循环 迭代 次 数 的 仿 射 (线性 ) 函数 。 
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第 10 章 指令 级 并 行 性 


每 一 个 现代 高 性 能 处 理 器 都 能 够 在 一 个 时 钟 周期 内 执行 多 条 指令 。 在 一 个 具有 指令 级 并 行 
机 制 的 处 理 器 上 一 个 程序 能 够 以 多 快 的 速度 运行 ? 这 可 是 一 个 “价值 十 亿美 元 的 问题 "。 对 这 个 
问题 的 回答 要 考虑 下 列 因素 : 

1) 该 程序 中 潜在 的 并 行 性 。 

2) 该 处 理 器 上 可 用 的 并 行 性 。 

3) 从 原来 的 顺序 程序 中 抽取 并 行 性 的 能 力 。 

4) 在 给 定 的 指令 调度 约束 之 下 找到 最 好 的 并 行 调度 方案 的 能 力 。 

如 果 一 个 程序 中 的 所 有 运算 之 间 都 是 高 度 依赖 的 , 那么 再 多 的 硬件 或 采用 并 行 化 技术 都 无 
法 使 这 个 程序 快速 并 行 执行 。 关 于 并 行 化 的 限制 方面 已 经 有 了 很 多 研究 。 典 型 的 非 数值 应 用 有 
很 多 固有 的 依赖 性 。 比 如 , 这 些 程序 具有 很 多 依赖 于 数据 的 分 支 , 使 得 哪怕 预测 一 下 下 面 将 执行 
哪 条 指令 都 变 得 很 困难 , 更 不 要 说 去 决定 哪些 运算 可 以 并 行 执行 了 。 因 此 , 这 个 领域 中 的 研究 工 
作 和 集中 在 放松 调度 约束 的 技术 , 包括 引入 新 的 体系 结构 特性 , 而 不 是 调度 技术 本 身 。 

数值 应 用 ( 比如 科学 计算 和 信号 处 理 ) 往 往 具有 更 好 的 并 行 性 。 这 些 应 用 处 理 大 型 的 聚合 数 
据 结 构 。 在 该 结构 的 不 同 元 素 上 的 运算 通常 是 相互 独立 的 , 可 以 并 行 地 执行 。 在 高 性 能 通用 机 器 
和 数字 信号 处 理 器 中 都 提供 了 附加 的 硬件 资源 来 利用 这 些 并 行 性 。 这 些 程序 通常 具有 简单 的 控 
制 结 构 和 规则 的 数据 访问 模式 。 已 经 有 一 些 静 态 技术 可 以 用 来 从 这 些 程序 中 抽取 出 可 用 的 并 行 
性 。 这 类 应 用 的 代码 调度 很 有 意思 也 很 重要 ， 因 为 它们 允许 大 量 的 独立 运算 被 映射 到 大 量 的 资 
源 上 运行 。 

并 行 性 抽取 和 并 行 执行 的 调度 可 以 通过 软件 静态 完成 , 也 可 以 通过 硬件 动态 进行 。 实 际 上 ， 
即使 是 具有 硬件 调度 机 制 的 机 器 也 可 以 辅 以 软件 调度 。 本 章 将 首先 解释 使 用 指令 级 并 行 性 的 一 
些 基 本 问题 。 不 管 是 硬件 管理 的 并 行 性 还 是 软件 管理 的 并 行 性 , 这 些 问题 都 是 一 样 的 。 然 后 我 
们 给 出 并 行 性 抽取 所 需 的 基本 数据 依赖 性 分 析 。 这 些 分 析 也 可 用 于 指令 级 并 行 性 之 外 的 其 他 优 
化 。 我 们 将 在 第 11 章 中 看 到 这 些 分 析 技术 的 其 他 应 用 。 

最 后 , 我 们 给 出 代码 调度 中 的 基本 思想 。 我 们 将 描述 一 个 用 于 基本 块 调度 的 技术 , 并 给 出 一 
个 方法 来 处 理 通用 程序 中 高 度数 据 依赖 的 控制 流 , 最 后 给 出 一 个 称 为 “软件 流水 线 化 ”的 技术 。 
软件 流水 线 化 技术 主要 用 于 数值 计算 程序 的 调度 。 


10.1 处 理 器 体系 结构 


当 我 们 考虑 指令 级 并 行 性 的 时 候 , 通常 设想 的 是 一 个 在 每 个 时 钟 周 期 内 发 出 多 条 运算 指令 
的 处 理 器 。 实 际 上 , 如 果 使 用 流水 线 (pipelining) 的 概念 , 即使 一 个 机 器 每 个 时 钟 周 期 引 发 送 一 条 
运算 指令 , 我 们 仍然 能 够 得 到 指令 级 并 行 性 。 下 面 , 我 们 将 首先 解释 流水 线 的 概念 , 然后 再 讨论 
多 指令 发 送 。 





O 在 合 义 明确 的 时 候 , 我 们 将 把 时 钟 “ 咬 噶 "或 者 时 钟 周期 简称 为 “时 钟 ”。 
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10.1.1 指令 流水 线 和 分 支 延 时 
在 实践 中 , 不 管 是 高 性 能 超级 计算 机 还 是 普通 的 机 器 ， 每 个 处 理 器 都 使 用 指令 流水 线 (in- 
struction pipeline) 。 使 用 指令 流水 线 , 每 个 时 钟 周 期 都 可 以 取得 一 个 新 指令 , 而 此 时 前 面 的 指令 还 











在 流水 线 中 执行 。 图 10.1 显示 的 是 一 个 简单 的 5 || 

阶段 指令 流水 线 : 它 首先 获取 指令 ( 正 ) ,对 该 指令 BARE, FW SB AHA 

解码 (ID), 执行 运算 (EX), 访问 内 存 (MEM) , 然 | 1 F 

后 回 写 结果 ( WB) 。 该 图 显示 了 指令 il i42 |S gx op T 

[+3 和 和 i+4 是 如 何 关 同一 时刻 并 行 运行 的 。 图 中 | 4 MEM BX DO Ie 

的 每 一 行 对 应 于 一 个 时 钟 周期 ， 而 每 一 列 指明 了 各 6 WB MEM EX ID 

条 指令 在 各 时 钟 周期 中 所 在 的 阶段 。 7 WB MEM EX 
如 果 在 后 续 指 令 需要 某 条 指令 的 结果 时 此 结果 | 9 ws | 





已 经 可 用 , 那么 处 理 器 就 可 以 在 每 个 时 钟 周期 内 发 
出 一 条 指令 。 分 支 指令 特别 容易 出 现 问题 , 因为 只 。 图 10-1 在 一 个 5 阶段 指令 流水 线 中 的 

有 在 它们 被 获取 、 解 码 并 执行 之 后 , 处 理 器 才能 够 五 个 连续 指令 

知道 下 面 该 执行 哪 条 指令 。 很 多 处 理 器 假设 分 支 不 会 跳 转 , 投机 性 地 选取 下 一 条 指令 并 解码 。 
但 是 当 这 个 分 支 真 的 需要 跳 转 的 时 候 , 指令 流水 线 被 清空 并 获取 分 支 跳 转 的 目标 指令 。 因 此 , 分 
支 跳 转 引入 了 为 获取 分 支 跳 转 目标 而 引起 的 延 时 ,并 使 得 指令 流水 线 “ 打 顺 "。 先 进 的 处 理 器 使 
用 硬件 根据 分 支 运 行 的 历史 来 预测 它们 的 结果 ，, 并 从 预测 的 目标 位 置 预 取 指令 。 但 是 如 果 分 支 
预测 错误 , 依然 会 出 现 分 支 延 时 。 

10. 1.2 流水 线 执 行 

有 些 指 令 的 执行 需要 几 个 时 钟 周期 。 一 个 常见 的 例子 是 内 存 加 载运 算 。 即 使 某 次 内 存 访问 
的 目标 数据 已 经 在 高 速 缓存 中 , 高 速 缓存 仍然 需要 多 个 时 钟 周 期 才 会 返回 数据 。 如 果 一 条 指令 
的 后 继 指令 在 不 需要 该 指令 的 运算 结果 时 可 以 立刻 往 下 执行 , 我 们 就 说 该 指令 的 执行 被 流水 线 
化 (pipelined) 了 。 因 此 ,即使 一 个 处 理 器 在 每 个 时 钟 周期 内 只 能 发 送 一 条 指令 , 但 仍然 可 能 在 同 
一 时 刻 有 多 条 指令 在 它们 各 自 的 阶段 上 执行 。 如 果 最 深 的 执行 流水 线 有 个 阶段 , 那么 在 同一 
时 刻 最 多 可 允许 nn 条 指令 处 于 执行 状态 。 请 注意 ,不 是 所 有 的 指令 都 是 完全 流水 线 化 的 。 虽 然 浮 
点 数 加 法 和 乘法 通常 都 被 完全 地 流水 线 化 了 , 但 更 加 复杂 且 很 少 执行 的 浮 点 数 除法 却 没有 做 到 
这 二 Ri 

大 多 数 通用 处 理 器 动态 地 检测 连续 指令 之 间 的 依赖 关系 ,并 在 指令 的 运算 分 量 尚 不 可 用 时 
自动 阻塞 这 些 指令 的 执行 。 有 些 处 理 器 , 特别 是 手持 设备 中 的 嵌入 式 芯 片 , 则 把 依赖 关系 检查 工 
作 留 给 软件 来 做 ,以 便 简化 硬件 并 降低 能 耗 。 在 这 种 情况 下 , 相应 的 编译 器 负责 在 必要 时 向 代码 
中 插入 “no-op” 指 令 ( 即 不 做 任何 处 理 的 指令 一 一 译 者 注 ) , 以 保证 需要 某 条 指令 的 计算 结果 时 该 
结果 一 定 可 用 。 

10. 1.3 多 指令 发 送 

通过 在 每 个 时 钟 周期 发 送 多 条 指令 , 处 理 器 可 以 在 同一 时 刻 运行 更 多 指令 。 可 同时 执行 的 
指令 数目 是 指令 发 送 宽 度 和 指令 执行 流水 线 中 平均 阶段 数目 的 乘积 。 

和 流水 线 处 理 类 似 , 多 发 送 机 器 的 并 行 性 既 可 以 通过 硬件 管理 , 也 可 以 通过 软件 管理 。 依 靠 软 
件 管理 其 并 发 性 的 机 器 称 为 VLIW( 非常 长 指令 字 ，Very-Long-Instruction-Word) 机 器 ， 而 那些 使 用 硬 
件 管理 其 并 发 性 的 机 器 称 为 超标 量 (superscalar) 机 器 。 顾名思义 , VLIW 机 器 的 指令 字 宽 度 比 一 般 指 
令 字 更 长 。 每 条 这 样 的 指令 字 是 要 在 同一 时 钟 周期 内 发 送 的 多 条 指令 的 编码 。 编 译 器 决定 哪些 运 
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算 将 被 并 行 地 发 送 , 并 把 这 些 信息 在 机 器 代码 中 明确 地 编码 。 另 一 方面 ,超标 量 机 器 有 一 个 普通 的 
指令 集 , 并 且 具 有 普通 的 顺序 执行 语义 。 超 标量 机 器 自动 检测 指令 之 间 的 依赖 关系 , 并 在 这 些 指令 
的 运算 分 量变 得 可 用 时 发 送 它们 。 有 些 处 理 器 同时 包含 VLIW 和 超标 量 两 种 功能 。， 

简单 的 硬件 指令 调度 器 按照 指令 获取 的 顺序 执行 指令 。 如 果 指 念 调度 器 碰 到 一 个 依赖 前 面 
指令 的 指令 , 那么 该 指令 及 其 全 部 后 继 指 令 必 须 等 待 依赖 关系 的 解除 ( 即 等 待 它 所 需 的 其 他 指令 
的 计算 结果 变 得 可 用 ) 。 如 果 有 一 个 静态 指令 调度 器 能 够 把 相互 独立 的 运算 按 执 行 顺序 放 在 一 
起 ,那么 这 样 的 机 器 显然 能 够 从 这 个 静态 指令 调度 器 获 益 。 

更 加 复杂 的 指令 调度 器 可 以 “ 颠 三 倒 四 ”地 执行 指令 。 指 令 可 以 被 单独 地 阻塞 , 直到 被 阻塞 
指令 所 需 的 所 有 值 都 已 经 生成 后 再 继续 执行 。 即 使 是 这 些 指 令 调度 器 也 可 以 从 静态 调度 获 益 ， 
因为 硬件 指令 调度 器 只 有 有 限 的 空间 来 缓冲 那些 必须 被 阻塞 的 指令 。 静 态 调度 可 以 把 相互 独立 
的 指令 放 得 比较 靠近 , 以便 更 好 地 利用 硬件 设施 。 更 重要 的 是 , 不 管 动态 指令 调度 器 有 多 复杂 ， 
它 都 不 能 执行 它 还 没有 获取 的 指令 。 当 处 理 器 不 得 不 执行 一 个 未 预见 的 分 支 时 , 它 只 能 在 新 近 
获取 的 指令 中 寻找 并 行 性 。 编译 器 可 以 设法 保证 这 些 新 获取 的 指令 可 以 并 行 执行 ， 以 此 来 增强 
动态 指令 调度 器 的 性 能 。 


10.2 代码 调度 约束 


代码 调度 是 程序 优化 的 一 种 形式 , 它 应 用 于 由 代码 生成 器 生成 的 机 器 代码 。 代 码 调度 要 遵 
守 下 面 三 种 约束 : 

1) 控制 依赖 约束 。 所 有 在 原 程序 中 执行 的 运算 都 必须 在 优化 后 的 程序 中 执行 。 

2) 数据 依赖 约束 。 优 化 后 的 程序 中 的 运算 必须 和 原 程序 中 的 相应 运算 生成 相同 的 结果 。 

3) 资源 约束 。 调 度 不 能 够 超额 使 用 机 器 上 的 资源 。 

这 些 调度 约束 保证 了 优化 后 的 程序 和 原 程 序 生 成 同样 的 结果 。 但 是 , 因为 代码 调度 改变 了 
运算 执行 的 顺序 , 所 以 优化 后 的 程序 执行 时 某 一 点 上 的 内 存 状态 可 能 和 顺序 执行 时 任 一 点 上 的 
内 存 状 态 都 不 匹配 。 如 果 一 个 程序 的 执行 因 蜡 常 或 用 户 设 定 的 断 点 而 中 断 时 , 就 会 产生 问题 。 
因此 经 过 优化 的 程序 比较 难以 调试 。 请 注意 ,这 个 问题 不 是 代码 调度 专 有 的 , 所 有 的 优化 技术 都 
会 出 现 这 个 问题 , 包括 部 分 匈 余 消除 ( 见 9.5 节 ) 和 寄存 器 分 配 ( 见 8.8 节 )。 

10.2.1 数据 依赖 
显然 , 如 果 两 个 运算 不 接触 同一 个 变量 , 那么 改变 这 两 个 运算 的 执行 顺序 肯定 不 会 影响 它们 
Wie 果 。 实 际 上 , 即使 这 两 个 运算 读 取 同一 个 变量 的 值 , 我们 仍然 可 以 交换 它们 的 执行 次 
序 。 只 有 当 一 个 运算 向 一 个 变量 写 值 ， 而 另 一 个 运算 对 这 个 变量 执行 读 或 写 运算 时 ,改变 它们 的 
执行 次 序 才 会 改变 它们 的 结果 。 这 样 的 一 对 操作 之 间 被 认为 存在 数据 依赖 (data dependence ) 关 
R, 并 且 它们 的 相对 执行 顺序 必须 保持 不 变 。 有 三 种 类 型 的 数据 依赖 关系 : 

1) 真 依赖 : 写 之 后 再 读 。 如 果 一 个 写 运 算 后 面 跟随 一 个 对 同一 个 位 置 的 读 运 算 , 那么 这 个 
读 操 作 就 依赖 于 被 写 人 的 值 , 这 种 依赖 关系 被 认为 是 一 个 真 依赖 关系 。 

2) 反 依 赖 : 读 之 后 再 写 。 如 果 一 个 读 运算 之 后 跟随 一 个 对 同一 个 位 置 的 写 运 算 , 我 们 说 看 
在 一 个 从 读 运 算 到 写 运算 的 反 依 赖 关系 。 写 运算 本 质 上 不 依赖 于 读 运算 , 但 是 如 果 写 运算 在 读 
e 那么 这 个 读 运算 将 读 取 到 错误 的 值 。 反 依赖 关系 是 强制 式 编程 的 一 个 副产品 。 

这 种 语言 中 同一 个 内 存 位 置 可 以 在 不 同时 刻 存放 不 同 的 值 。 这 不 是 一 个 “ 真 ” 依赖 关系 ,可 以 把 
值 存放 在 不 同 的 位 置 上 以 达到 消除 反 依赖 关系 的 目的 。 

3) 输出 依赖 : 写 之 后 再 写 。 对 同一 个 位 置 的 两 个 写 运 算 之 间 有 输出 依赖 关系 。 如 果 违 反 了 
这 个 关系 , 那么 在 这 两 个 运算 都 完成 之 后 , 被 写 内 存 位 置 上 存放 的 是 错误 的 值 。 
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反 依赖 关系 和 输出 依赖 关系 被 称 为 存储 相关 的 依赖 (storage-related dependence) 。 这 些 都 不 
是 “ 真 "的 依赖 关系 , 可 以 通过 使 用 不 同 的 内 存 位 置 存放 不 同 的 值 来 消 除 这 些 依赖 关系 。 请 注意 ， 
数据 依赖 关系 对 于 内 存 访问 和 寄存 器 访问 同样 有 效 。 

10.2.2 寻找 内 存 访问 之 间 的 依赖 关系 

要 检查 两 个 内 存 访问 之 间 是 否 有 数据 依赖 关系 , 我们 只 需要 指出 它们 是 否 可 能 指向 同一 个 
内 存 位 置 , 而 不 需要 知道 到 底 访 问 哪 个 位 置 。 比 如 , 虽然 我 们 可 能 不 知道 指针 p 到 底 指 向 哪里 ， 
但 仍然 可 以 指出 两 个 访问 *p 和 *(p +4)( 原 文 为 (“p) +4 译 者 注 ) 不 可 能 指向 同一 个 位 
= ARA, 数据 依赖 关系 是 不 可 能 在 编译 时 刻 完全 确定 的 。 除 非 能 够 证 明 两 个 运算 指向 不 
同 的 位 置 , 否则 编译 器 必须 假设 它们 可 能 会 指向 同一 个 位 置 。 

给 定 下 面 的 代码 序列 
j a 





1; 


2) *P : 2; 

e a E a rs 

除非 编译 器 知道 不 可 能 指向 a, 否则 它 必须 决定 这 三 个 运算 需要 顺序 执行 。 从 语句 (1) 到 
语句 (2) 有 一 个 输出 依赖 关系 ,从 语句 (1) (2) 到 语句 (3) 有 两 个 真 依赖 关系 。 加 


数据 依赖 分 析 对 于 程序 所 使 用 的 程序 设计 语言 是 很 敏感 的 。 对 于 非 类 型 安全 的 语言 ,比如 C 
和 C++ ,一 个 指针 可 以 被 强制 转换 , 指向 任何 类 型 的 数据 对 象 , 因此 要 证 明 任 意 一 对 基于 指针 
的 内 存 访 问 之 间 的 独立 性 需要 复杂 的 分 析 过 程 。 即 使 对 于 局 部 变量 和 全 局 标量 变量 , 除非 可 以 
证 明 它们 的 地 址 没有 被 程序 中 的 指令 存放 到 任何 地 方 , 它们 也 有 可 能 通过 指针 被 间接 访问 。 在 
像 Java 这 样 的 类 型 安全 的 语言 中 , 不 同类 型 的 对 象 一 定 是 相互 独立 的 。 类 似 地 , 栈 中 的 局 部 简单 
变量 不 可 能 通过 其 他 的 变量 名 字 进 行 访问 。 

发 现 正确 的 数据 依赖 关系 需要 多 种 不 同类 型 的 分 析 。 我 们 将 关注 那些 主要 的 问题 。 如 果 编 
译 器 想 要 检测 一 个 程序 中 的 所 有 数据 依赖 关系 , 它 必须 首先 解决 这 些 问题 , 并 说 明 如 何 使 用 这 些 
信息 进行 代码 调度 。 后 面 的 章节 将 说 明 这 些 分 析 是 如 何 完 成 的 。 

数组 的 数据 依赖 分 析 

数组 的 数据 依赖 分 析 问 题 主 要 是 区 分 数组 元 素 访问 中 的 下 标 值 。 比 如 ,下 面 的 循环 


for (E08 a ny rit) 
A[2*i] = A[2*i+1]; 


把 数组 4 的 奇数 号 元 素 拷 贝 到 紧 靠 在 该 元 素 之 前 的 偶数 号 元 素 中 去 。 因 为 这 个 循环 中 所 有 的 读 / 
写 运算 的 位 置 互 不 相同 , 这 些 访问 之 间 没 有 任何 依赖 关系 , 所 以 循环 中 所 有 的 迭代 都 可 以 并 行 执 
行 。 数 组 的 数据 依赖 分 析 , 简称 为 数据 依赖 分 析 ( data-dependence analysis) ,对 于 数值 应 用 的 优化 
来 说 是 非常 重要 的 。 这 个 主题 将 在 11. 6 节 中 详细 讨论 。 

指针 别名 分 析 

如 果 两 个 指针 指向 同一 个 对 象 , 我 们 就 说 它们 互 为 别名 (aliased)。 指 针 别 名 的 分 析 很 困难 ， 
原因 是 一 个 程序 中 具有 很 多 可 能 互 为 别名 的 指针 。 随 着 时 间 的 发 展 , 它们 中 的 每 个 都 可 能 指向 
无 限 多 个 动态 对 象 。 为 了 得 到 精确 的 信息 ,进行 指针 别名 分 析 时 必须 跨越 程序 中 的 各 个 函数 。 
这 个 主题 从 12. 4 节 开 始 讨 论 。 

过 程 间 分 析 

对 于 通过 引用 传递 参数 的 语言 , 需要 使 用 过 程 间 分 析 来 确定 是 否 同一 个 变量 被 当 作 两 个 或 
多 个 不 同 的 参数 进行 传递 。 这 类 别名 看 起 来 可 能 会 在 不 同 的 参数 之 间 建 立 依赖 关系 。 类 似 地 ， 
全 局 变量 可 能 被 用 作 参 数 , 由 此 会 建立 参数 访问 和 全 局 变量 访问 之 间 的 依赖 。 在 确定 这 些 别 名 
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时 , 第 12 章 中 讨论 的 过 程 间 分 析 技 术 是 必需 的 。 
10.2.3 ”寄存 器 使 用 和 并 行 性 之 间 的 折衷 

在 这 一 章 中 ,我 们 将 假设 源 程序 的 机 器 无 关中 间 表 示 形 式 使 用 了 无 限 多 个 伪 寄 存 器 (pseud- 
oregister) 。 这 些 伪 寄 存 器 代表 了 可 以 分 配 到 寄存 器 的 变量 。 这 些 变 量 包 括 源 程 序 中 不 能 通过 任 
何其 他 名 字 访 问 的 标量 , 也 包括 由 编译 器 生成 的 用 于 存放 表达 式 的 部 分 结果 的 临时 变量 。 和 内 
存 位 置 不 同 , 寄存 器 的 命名 是 唯一 的 。 因 此 可 以 很 容易 地 为 寄存 器 访问 生成 精确 的 数据 依赖 
约束 。 

在 中 间 表 示 形 式 中 使 用 的 无 限 多 个 伪 寄 存 器 最 终 必须 被 映射 到 在 目标 机 器 上 可 用 的 少量 物 
理 寄 存 器 。 把 几 个 伪 寄 存 器 映射 为 同一 个 物理 寄存 器 有 一 个 副作用 。 这 种 映射 会 生成 人 为 的 存 
储 依赖 , 这 限制 了 指令 级 的 并 行 性 。 反 过 来 , 并 行 执 行 指 令 产 生 了 更 多 的 存储 需求 ,以便 存 放 同 
时 计算 出 来 的 值 。 因 此 , 尽量 降低 寄存 器 使 用 数量 的 目标 和 最 大 化 指令 级 并 行 性 的 目标 直接 冲 
突 。 下 面 的 例 10.2 和 例 10. 3 说 明了 存储 和 并 行 性 之 间 的 典型 折衷 处 理 。 





硬件 寄存 器 重 命名 

指令 级 并 行 性 首先 是 作为 一 种 加 快 普通 的 顺序 机 器 代码 执行 速度 的 手段 在 计算 机 体系 结 
构 中 使 用 的 。 当 时 的 编译 器 还 不 知道 机 器 上 的 指令 级 并 行 性 ; 其 目标 是 优化 寄存 器 的 使 用 。 
它们 仔细 地 重新 排列 指令 以 使 所 用 的 寄存 器 数目 最 少 , 但 同时 也 使 可 用 的 并 行 性 的 数量 减 到 
最 少 。 例 10. 3 说 明 的 是 在 表达 式 树 的 计算 过 程 中 最 小 化 寄存 器 使 用 的 同时 也 限制 了 它 的 并 
行 性 。 j 

在 顺序 代码 中 的 并 行 性 太 少 了 ,计算 机 体系 结构 设计 师 不 得 不 发 明了 硬件 寄存 器 重 命名 
(hardware register renaming) 的 概念 , 试图 通过 寄存 器 重 命名 来 撤销 寄存 器 优化 所 带 来 的 影响 。 
硬件 寄存 器 重 命名 在 程序 运行 时 动态 地 改变 寄存 器 的 指派 。 它 对 机 器 代码 进行 解释 ,把 本 来 
存放 在 同一 个 寄存 器 中 的 值 存放 在 不 同 的 内 部 寄存 器 中 , 并 把 对 这 些 值 的 使 用 修正 到 相应 的 
内 部 寄存 器 。 

因为 人 为 的 寄存 器 依赖 约束 首先 是 由 编译 器 引入 的 ,如 果 使 用 了 一 个 认识 到 指令 级 并 行 
性 的 寄存 器 分 配 算法 ,这些 约束 就 可 以 被 消除 。 当 一 个 机 器 的 指令 集 只 能 引用 少量 寄存 器 时 ， 
硬件 寄存 器 重 命名 机 制 仍然 是 有 用 的 。 这 种 能 力 使 得 我 们 可 以 给 出 这 个 指令 集体 系 结构 的 更 
好 的 实现 ,把 代码 中 的 由 指令 集体 系 结构 规定 的 少量 寄存 器 动态 地 映射 到 多 得 多 的 内 部 寄存 
$e ko 











D 下 面 的 代码 使 用 伪 寄 存 器 tl 和 t2 把 位 于 位 置 Ac 上 的 变量 的 值 分 别 复制 到 在 位 
Hb Ald 上 的 变量 中 。 


LD ti, a //tiza 
STLab eth //b = tl 
LD L200 [f tzie 
ST ds 2 Jha ata 


如 果 已 知 所 有 被 访问 的 内 存 位 置 都 互 不 相同 , 那么 上 面 的 复制 过 程 可 以 并 行进 行 。 但 是 ,如果 为 
了 尽量 降低 所 用 寄存 器 的 数量 而 把 tl 和 t2 赋 给 同一 个 寄存 器 , 那么 复制 过 程 就 只 能 顺序 进 
47 ies E 
ERE 传统 的 寄存 器 分 配 技术 的 目标 是 尽 可 能 减少 一 个 计算 过 程 所 需要 的 寄存 器 数目 。 考 
虑 表达 式 


(a+b) +c+ (d +e) 
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图 10.2 显示 了 它 的 语法 树 。 如 图 10-3 的 机 器 代码 所 示 , 可 以 使 用 3 个 寄存 器 来 完成 这 个 表达 式 
的 计算 。 

但 是 , 对 寄存 器 的 复 用 使 得 计算 串 行 化 。 唯 一 可 以 并 行 执 行 的 运算 是 把 位 置 a A b 的 值 加 
载 到 寄存 器 , 以 及 把 位 置 a M e 的 值 加 载 到 寄存 器 。 因 此 并 行 地 完成 这 个 计算 共 需 要 7 步 。 





LD ri, a // rli=a 
LD r2, b //'r2=b 
F Li ri // ri = ritr 
see) a Way Ç ‘ // F = ri 2 
+ + ADD rl) IT, // ri"= ritr2 
LD r2, d r2 =å 
o oe LD r3, e // rx3 = e 
ADD T25 r2, // r2 = oy 
ENS ADD ri, om // ri = ri+r2 
图 10-2 fil 10.3 中 的 表达 式 树 图 10-3 图 10-2 中 表达 式 的 机 器 代码 
假如 我 们 使 用 不 同 的 寄存 器 来 存放 各 个 部 分 和 , 这 个 表达 式 可 以 在 4 步 内 完成 求 值 。 这 个 步 
数 正 好 是 图 102 中 的 表达 式 树 的 高 度 。 图 10-4 给 出 了 这 样 的 并 行 计算 过 程 s Oo 
r3=c|)r4=d 


















Il = a r2=b r5 = e 
r6 = ritr2 | r7 = r4+r5 

r8 = r6+r3 

r9 = r8+r7 


Al 10-4 图 10-2 中 表达 式 的 并 行 求 值 过 程 


10.2.4 寄存 器 分 配 阶 段 和 代码 调度 阶段 之 间 的 顺序 

如 果 在 代码 调度 之 前 进行 寄存 器 分 配 , 那么 得 到 的 代码 往往 会 有 很 多 存储 依赖 , 而 这 会 限制 
代码 调度 。 另 一 方面 , 如 果 在 寄存 器 分 配 之 前 先进 行 代码 调度 , 那么 得 到 的 代码 调度 方案 可 能 需 
要 太 多 的 寄存 器 , 以 至 于 寄存 器 溢出 (spilling) 会 抵消 指令 级 并 行 性 所 带 来 的 好 处 。 所 谓 寄存 器 
溢出 是 指 把 一 个 寄存 器 中 的 内 容 保 存 到 一 个 内 存 位 置 上 , 使 得 该 寄存 器 可 以 用 于 其 他 目的 。 一 
个 编译 器 应 该 首先 分 配 寄存 器 然后 再 进行 代码 调度 吗 ? 还 是 应 该 按照 相反 顺序 处 理 ?” 或 者 我 们 
同时 解决 这 两 个 问题 ? 

为 了 回答 上 面 的 问题 , 我 们 必须 考虑 被 编译 程序 的 特性 。 很 多 非 数值 应 用 没有 那么 多 可 用 
的 并 行 性 。 把 少量 的 寄存 器 专门 用 于 保存 表达 式 的 临时 结果 就 足够 了 。 我 们 可 以 首先 应 用 8. 8. 4 
节 中 所 述 的 着 色 算 法 ,为 所 有 非 临时 变量 分 配 寄存 器 , 然后 进行 代码 调度 , 最 后 为 临时 变量 分 配 
寄存 器 。 

这 个 方法 对 于 数值 应 用 的 效果 就 不 太 好 (数值 应 用 中 有 很 多 大 型 表达 式 ) 。 我 们 可 以 使 用 层 
次 化 的 方法 来 处 理 。 代 码 优化 首先 从 最 内 层 循环 开始 , 按照 从 内 向 外 的 顺序 进行 。 首 先进 行 指 
令 调度 , 此 时 假设 可 以 给 每 个 伪 寄 存 器 分 配 一 个 独占 的 物理 寄存 器 。 然 后 进行 寄存 器 分 配 ， 并 在 
需要 的 地 方 加 入 处 理 寄存 器 溢出 的 代码 , 然后 再 次 对 代码 进行 调度 。 然 后 我 们 对 较 外 层 的 循环 
重复 这 个 过 程 。 当 把 同一 个 外 层 循环 中 的 多 个 内 层 循环 一 起 考虑 时 ， 同 一 个 变量 可 能 在 不 同 内 
层 循环 中 被 分 配 到 不 同 的 寄存 器 中 。 我 们 可 以 改变 寄存 器 的 分 配方 案 , 以 避免 把 值 从 一 个 寄存 
器 复制 到 另 一 个 寄存 器 。 在 10.5 节 中 , 我 们 将 在 特定 调度 算法 的 上 下 文 环境 下 进一步 讨论 寄存 
器 分 配 和 指令 调度 之 间 的 关系 。 
10.2.5 控制 依赖 

对 一 个 基本 块 内 的 运算 进行 调度 是 相对 容易 的 。 因 为 一 旦 控制 流 到 达 基 本 块 的 开头 , 所 有 
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的 指令 都 必然 会 执行 。 只 要 满足 所 有 的 数据 依赖 ， 一 个 基本 块 内 的 指令 可 以 进行 任意 重新 排序 。 
遗憾 的 是 , 基本 块 通常 都 很 小 , 对 非 数值 程序 而 言 尤其 如 此 。 一 个 基本 块 平均 只 有 大 约 五 条 指 
令 。 另外, 同一 个 基本 块 内 的 运算 经 常 是 紧密 相关 的 ， 因此 很 少 有 并 行 性 。 可见, 利用 基本 块 之 
间 的 并 发 性 是 至 关 重 要 的 。 

一 个 优化 后 的 程序 必须 执行 原 程 序 中 的 所 有 运算 。 它 可 以 比 原 程序 执行 更 多 的 指令 , 前 提 
是 额外 增加 的 指令 没有 改变 程序 所 做 的 计算 。 为 什么 执行 额外 的 指令 能 够 加 快 一 个 程序 的 执行 
速度 ”如 果 我 们 知道 一 条 指令 可 能 会 执行 ， 而 且 有 空闲 的 资源 来 “免费 ”执行 这 个 指令 , 我 们 就 
可 以 先 投 机 性 地 ( speculatively) 执 行 这 条 指令 。 如 果 这 个 投机 是 正确 的 ， 那么 程序 的 执行 速度 就 
会 变 快 。 

如 果 指 令 六 的 结果 决定 了 指令 记 是 否 执 行 ， 那么 就 说 指令 是 控制 依赖 (control-dependent) 
于 指令 i 的 。 控 制 依赖 的 概念 和 块 结构 程序 中 的 嵌 套 层次 相对 应 。 明 确 地 说 , 在 让 else 语句 

if (c) si; else s2; 

中 ,sl 和 s2 是 控制 依赖 于 c 的。 类 似 地 , 在 while 语句 

while (c) s; 

中 , 循环 体 : 控制 依赖 于 co 
ABORI 在 代码 片段 


if (a > t) 
b = a*a; 
d = atc; 


中 , 语句 b -axa 和 a=a+ea 和 此 片断 中 的 其 他 部 分 都 没有 数据 依赖 关系 。 语 句 P =a * a 依赖 
于 比较 表达 式 a >t。 但 是 , 语句 d = a +c 不 依赖 于 这 个 比较 表达 式 , 它 可 以 在 任何 时 刻 运行 。 
假设 乘法 运算 a * a 不 会 引起 任何 副作用 , 那么 它 就 可 以 被 投机 地 执行 , 前 提 是 只 有 在 发 现 a 大 
于 t 之 后 才 把 结果 写 入 b 中 。 Oo 
10.2.6. 对 投机 执行 的 支持 

内 存 加 载 指 令 是 能 够 从 投机 执行 中 获得 很 大 好 处 的 指令 类 型 。 当 然 , 内 存 加 载 是 很 常见 
的 。 它 们 有 上 比较 长 的 执行 延 时 , 加 载 指 令 中 使 用 的 地 址 通常 可 以 预先 知道 , 且 结 果 可 以 存放 
到 一 个 新 的 临时 变量 中 而 不 会 破坏 任何 其 他 变量 的 值 。 遗 憾 的 是 ,如 果 它 们 的 地 址 是 非法 的 ， 
内 存 加 载 可 能 会 引发 异常 ,因此 投机 性 地 访问 非法 地 址 可 能 会 使 一 个 正确 的 程序 意外 地 停止 
执行 。 另外, 预测 错误 的 内 存 加 载 可 能 引起 额外 的 高 速 缓存 脱 靶 和 页 面 错 误 , 这 些 问题 的 代 
价 都 非常 大 。 


在 代码 片段 


if (p != null) 
q= *p; 

中 , 如 果 p 的 值 是 null, 投机 性 地 对 p 解 引用 可 能 会 使 得 正确 的 程序 停止 执行 。 E 

很 多 高 性 能 处 理 器 都 提供 了 特殊 的 功能 来 支持 投机 性 内 存 访问 。 下 面 我 们 给 出 其 中 一 些 最 
重要 的 特殊 功能 。 

预 取 指 令 

ANIER T IR (prefetch) 指令 ,以 便 在 数据 被 使 用 之 前 将 其 从 内 存 移 动 到 高 速 缓存 。 一 个 
预 取 指令 向 处 理 器 表明 该 程序 可 能 很 快 就 要 使 用 特定 内 存 字 。 如 果 指 定 的 内 存 位 置 不 可 用 , 或 
者 访问 该 位 置 会 引起 页 面 错 误 , 那么 处 理 器 可 以 直接 忽略 这 个 指令 。 否 则 , 如 果 该 数据 不 在 高 速 
缓存 中 , 处 理 器 将 把 该 数据 从 内 存 移动 到 高 速 缓存 。 
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毒药 位 

另 一 个 体系 结构 特征 被 称 为 毒药 位 (poison bit) o 大 们 发 明 毒 药 位 以 便 投 机 性 地 把 数据 从 内 
存 加 载 到 寄存 器 文件 。 该 机 器 上 的 每 个 寄存 器 都 增加 了 一 个 毒药 位 。 如 有 果 访 问 了 非法 内 存 , 或 
者 被 访问 的 页 面 不 在 内 存 中 ,处 理 器 并 不 立刻 引发 异常 ,而 是 仅仅 设置 目标 寄存 器 的 毒药 位 。 只 
有 当 其 毒药 位 被 置 位 的 寄存 器 中 的 内 容 被 使 用 时 才 会 引发 一 个 异常 。 

带 断 言 的 执行 

因为 分 支 运 算 的 开销 很 大 , 而 预测 错误 的 分 支 的 开销 更 大 ( 见 10.14), AAT ACB Be 
的 指令 (predicated instruction) 以 减少 一 个 程序 中 的 分 支 数 量 。 一 条 带 断 言 的 指令 和 一 条 普通 指令 
类 似 , 但 是 它 有 一 个 额外 的 断言 运算 分 量 , 作为 它 的 执行 条 件 。 只 有 在 该 断言 被 满足 时 指令 才 会 
执行 。 

例如 , 一 个 带 条 件 的 移动 指令 CMOVZ R2, R3, RI 的 语义 是 只 有 当 寄 存 器 R1 的 值 为 零 时 寄 
FER R3 的 内 容 才 会 被 移动 到 寄存 器 R2。 假 设 a.b\c 和 4 分 别 分 配 到 寄存 器 R1 、R2、R4、R5 中 ， 
下 面 的 代码 


if (a == 0) 
b = ctd; 


可 以 使 用 如 下 两 条 机 器 指令 实现 : 


ADD R3, R4, R5 
CMOVZ R2, R3, Ri 


FEE LEH OSE TE SR FE ORAS. BR Ye Ts 
令 可 以 和 相 邻 的 基本 块 合并 , 形成 更 大 的 基本 块 。 更 重要 的 是 , 使 用 这 些 代码 , 处 理 器 就 不 会 产 
生 预 测 错误 , 因此 保证 了 指令 流水 线 的 平滑 运行 。 

带 断 言 的 执行 也 是 有 代价 的 。 即 使 最 后 不 需要 执行 带 断 言 的 指令 , 处 理 器 也 必须 获取 该 指 
令 并 解码 。 静 态 调度 器 必须 保留 执行 它们 所 需要 的 资源 ,并 保证 所 有 可 能 的 数据 依赖 都 得 到 满 
足 。 除 非 机 器 拥有 的 资源 大 大 多 于 不 使 用 带 断 言 指令 时 所 需要 的 资源 , 否则 不 应 该 过 度 使 用 带 


断言 指令 。 








动态 调度 机 器 

使 用 静态 调度 的 机 器 的 指令 集 明 确 地 定义 了 哪些 指令 可 以 并 行 执 行 。 但 是 , 回顾 一 下 
10. 1.2 节 , 有 些 机 器 的 体系 结构 允许 到 运行 时 刻 再 确定 哪些 指令 可 以 并 行 运行 。 使 用 动态 调 
度 , 同样 的 机 器 代码 可 以 在 同一 系列 的 不 同 机 器 上 运行 。 这 些 机 器 实现 了 同样 的 指令 集 , 但 
是 拥有 不 同 数量 的 并 行 执行 支持 设施 。 实 际 上 , 机 器 代码 级 的 兼容 是 动态 调度 机 器 的 一 个 主 
要 优点 。 

用 软件 方式 在 编译 器 中 实现 的 静态 调度 器 可 以 帮助 (用 机 器 硬件 实现 的 ) 动态 调度 器 更 
好 地 利用 机 器 资源 。 在 为 一 个 动态 调度 机 器 构造 一 个 静态 调度 器 时 ,我们 几乎 可 以 照搬 为 静 
态 调度 机 器 设计 的 调度 算法 ,只 是 新 算法 不 需要 明确 地 生成 原 算法 放置 在 调度 方案 中 的 no- 
op 指令 。 这 个 问题 将 在 10. 4.7 中 进一步 讨论 。 


10. 2.7 一 个 基本 的 机 器 模型 

很 多 机 器 可 以 使 用 下 面 的 简单 模型 表示 。 一 个 机 器 M = <R,T> 由 下 列 元 素 组 成 : 

1) 一 个 运算 类 型 的 集合 7T。 这 些 运算 类 型 包括 加 载 、 保 存 、 算 术 运 算 等 。 

2) 一 个 代表 硬件 资源 的 向 量 尺 = [r r] 其 中 表示 第 i 种 资源 的 可 用 单元 的 数目 。 典 
型 资源 的 例子 包括 : 内 存 访问 单元 、 算术 人 逻辑 单元 ( ALU) 和 浮 点 功能 单元 。 
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每 条 指令 具有 一 组 输入 运算 分 量 、 一 组 输出 运算 分 量 和 一 个 资源 需求 。 每 一 个 输入 运算 
分 量 都 有 一 个 对 应 的 输入 延 时 。 这 个 延 时 表示 输入 值 (相对 于 运算 开始 时 刻 ) 必须 在 什么 时 候 
可 用 。 典 型 的 输入 运算 分 量 的 延 时 是 零 , 表明 立刻 就 需要 使 用 这 些 值 。 类 似 地 , 每 个 输出 运 
算 分 量 有 一 个 对 应 的 输出 延 时 。 这 个 延 时 表明 了 运算 结果 (相对 于 运算 开始 时 刻 ) 什么 时 候 
可 用 。 

每 个 + 类 型 的 机 器 运算 指令 需要 使 用 的 资源 可 以 建 模 为 一 个 二 维 的 资源 预约 表 ( resource-res- 
ervation table) , RT,。 该 表 的 宽度 是 机 器 中 资源 的 种 类 数量 ， 它 的 长 度 是 该 运算 使 用 资源 的 时 间 
长 度 。 表 格 中 的 条 目 RT,[i, 站 表示 在 1 类 型 的 运算 指令 被 发 出 i 个 时 钟 周期 后 该 运算 指令 占用 的 
第 j 种 资源 的 数量 。 为 了 简化 表示 方法 ， mE i 指向 一 个 表格 中 不 存在 的 条 目 (也 就 是 ; 比 执行 该 
运算 所 需 的 时 钟 数 大 ) , RIRE RT, i,j] =0。 当 然 , 对 于 任何 i 和 jj RT, i, j DAN FRE 
于 R[j], 也 就 是 该 机 器 拥有 的 第 7 种 资源 的 总 数 。 

典型 的 机 器 运算 指令 在 其 被 发 出 时 只 占用 一 个 单元 的 资源 。 有 些 运算 可 能 使 用 多 个 功能 单 
元 。 比 如 , 一 个 相 乘 再 相 加 的 指令 可 能 在 第 一 个 时 钟 周 期 使 用 一 个 乘法 器 ， 在 第 二 个 周期 使 用 一 
个 加 法 器 。 有 些 运算 ( 比如 除法 运算 ) 可 能 需要 占用 一 个 资源 多 个 时 钟 周期 。 完 全 流水 线 化 (fully 
pipelined) 的 运算 是 指 那 些 在 每 个 时 钟 周期 都 可 以 发 出 一 条 指令 的 运算 ， 虽然 这 些 运 算 的 结果 可 
能 要 等 到 几 个 时 钟 周期 之 后 才 可 用 。 我 们 不 需要 明确 地 对 一 条 流水 线 的 各 个 阶段 的 资源 建 模 ， 
只 需要 用 一 个 单元 对 第 一 个 阶段 建 模 就 可 以 了 。 占用 了 某 条 流水 线 的 第 一 阶段 的 运算 一 定 能 够 
在 下 一 个 时 钟 周期 进入 下 一 个 阶段 。 

10.2.8 10.2 节 的 练习 

练习 10. 2. 1: 图 10-5 中 的 多 个 赋值 语句 具有 某 些 依赖 关系 。 对 于 下 列 的 每 个 语句 对 , 将 它们 
之 间 的 依赖 关系 按照 下 列 四 种 情况 进行 分 类 。 (1) 真 依赖 , (2) 反 依 
赖 ，(3) 输 出 依赖 ，(4) 无 依赖 关系 ( 即 两 条 指令 可 以 按照 任何 顺序 
出 现 )。 

1) 语句 (1) 和 (4)。 

2) 语句 (3) 和 (5)。 

3) 语句 (1) 和 (6)。 

4) 语句 (3) 和 (6)。 

5) 语句 (4) 和 (6)。 

练习 10. 2. 2: 严格 按照 括号 顺序 ( 即 不 使 用 交换 律 和 结合 律 来 改变 加 法 的 顺序 ) 对 表达 式 
((utv) + (w+%))+(y+z) 求 值 。 给 出 寄存 器 层次 的 机 器 代码 , 要 求 此 代码 具有 尽 可 能 大 的 并 
行 性 。 





10-5 一 组 展示 了 数据 
依赖 性 的 赋值 语句 序列 














1) LD ri, u ff TL = 

练习 10.2.3: 对 下 列表 达 式 重复 练习 10.2.2。 2) LD r2, v // rz2 =v 
a) ADD ri, ri, r2 Eh oh E E ch (fg 

1) (wu+(vt(w+%))) +(y+z) ts pd 


2) (w+(v+w)) +t(%+(y+z)) 5) LD rôi x // x3 =x 

如 果 我 们 不 是 要 把 并 行 性 最 大 化 ,而 是 要 最 | |) one 
小 化 所 用 的 寄存 器 数目 , 这 个 计算 过 程 将 执行 多 | 8) ID r2, y arsy 

少 步 ? 通过 将 并 行 性 最 大 化 , 我 们 省 下 了 多 少 | 10) ime t2 r3 // 12 t24 r3 
HERE? 11) ADD ant pid onl art 22 

练习 10.2.4; 练习 10.2.2 中 的 表达 式 可 以 使 

FIA 10-6 HOHE. RR a | A TR AAA 
多 的 并 行 机 制 , 执行 这 些 指 令 需 要 多 少 步 ? 寄存 器 的 实现 
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! 练习 10.2.5: 使 用 10.2.6 节 中 的 条 件 拷贝 指令 CMOVZ 来 翻译 例 10.4 中 的 代码 片断 。 机 
器 代码 中 的 数据 依赖 关系 是 什么 ? 


10.3 “基本 块 调度 


我 们 现在 可 以 开始 讨论 代码 调度 算法 了 。 我 们 从 最 简单 的 问题 开始 ， 对 一 个 由 机 器 指令 组 
成 的 基本 块 进行 调度 。 给 出 这 个 问题 的 最 优 解 的 复杂 度 是 NP 完全 的 。 但 是 在 实践 中 , 一 个 典型 
的 基本 块 只 有 少量 相互 之 间 高 度 约束 的 运算 , 因此 使 用 简单 的 调度 算法 就 足够 了 。 我 们 将 介绍 
一 个 称 为 列表 调度 (list scheduling) 的 简单 且 非 常 高 效 的 算法 来 解决 这 个 问题 。 


10. 3.1 数据 依赖 图 


我 们 把 每 个 由 机 器 指令 组 成 的 基本 块 表示 成 为 二 个 数据 依 脱 A (data-dependence graph), G = 
(NE), PERSE N 表示 基本 块 中 机 器 指令 的 运算 , 而 有 向 边 集 合 表示 运算 之 间 的 数据 依 
MAR, G 的 结 点 集合 和 边 集 按照 如 下 方式 构造 : 

1) ÆN 中 的 每 个 运算 于 有 一 个 资源 预约 表 RT, HARE n 的 运算 类 型 所 对 应 的 资源 预 
约 表 。 

2) 中 的 每 条 边 e 有 一 个 表示 延 时 的 标号 4,。 该 标号 表明 目标 结 点 必须 在 源 结 点 发 出 后 至 
Dd, 个 时 钟 周期 之 后 发 出 。 假 设 运算 n 之 后 跟 有 运算 n, 并 且 两 条 指令 访问 同一 个 内 存 位 置 ， 
Dil AEM AY 1, 和 和。 也 就 是 说 ， 该 位 置 上 的 值 在 第 一 条 指令 开始 之 后 的 第 Li 个 时 钟 周期 
ER, 且 第 二 条 指令 在 其 开始 后 的 第 2 个 时 钟 周 期 需要 这 个 值 ， 请 注意 , 在 通常 情况 下 4 =1 而 
hL =0。 那 么 , 中 有 一 个 延 时 标号 为 11 -7 的 边 有 1 一 *722 。 
生肖 考虑 一 个 可 以 在 每 个 时 钟 周 期 内 执行 两 个 运算 的 机 骂 。 其 中 第 一 个 运算 必须 是 分 支 
运算 或 者 以 下 形式 的 ALU 运算 : 

OP dst, Brci, sre? 

第 二 个 运算 必须 是 如 下 形式 的 加 载运 算 或 者 保存 运算 ， 


LD dst, addr 
ST addr, src 


其 中 的 加 载运 算 (LD) 是 完全 流水 线 化 的 并 占用 两 个 时 钟 周期 。 但 是 , 一 个 加 载运 算 后 面 可 
以 立刻 跟 一 个 向 被 读 内 存 地址 进行 写 运算 的 保存 运算 sT。 所 有 其 他 的 运算 都 在 一 个 时 钟 周 期 内 
完成 8 





a | 


资源 预约 表 的 图 示 方 法 

把 一 个 运算 的 资源 预约 表 用 实心 和 空心 方块 组 成 的 网 格 可 视 化 地 表示 出 来 是 非 党 有 用 
的 。 在 网 格 中 , 每 一 列 对 应 于 目标 机 器 上 的 一 种 资源 ， 而 每 一 行 表示 该 运算 执行 中 的 一 个 时 
钟 周期 。 假 设 对 于 每 种 类 型 的 资源 ， 这 个 运算 最 多 只 需要 一 个 单元 , 我 们 就 可 以 使 用 实心 方 
块 表示 1, 用 空心 方块 表示 0。 为 外 ,如 果 该 指令 是 完全 流水 线 化 的 , IZ 只 需要 指明 在 第 一 
行 中 使 用 的 资源 ,相应 的 资源 预约 表 变 成 了 单独 的 一 行 ， 

例如 , 这 个 表示 方式 在 例 10. 6 中 使 用 。 在 图 10-7 中 ,我 们 可 以 看 到 各 个 资源 预约 表 都 是 
单行 的 。 其 中 的 两 个 加 法 运算 需要 “alu”" 资 源 ,而 加 载 和 保存 运算 需要 “mem” 资 源 。 











图 10-7 中 显示 的 是 一 个 基本 块 例子 的 依赖 图 和 它 的 资源 需求 。 我 们 可 以 想像 R1 是 一 个 栈 
指针 , 用 来 通过 诸如 0 或 者 12 这 样 的 偏 移 量 访问 栈 中 的 数据 。 第 一 条 指令 向 寄存 器 R2 中 加 载 数 
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据 , 直到 两 个 时 钟 周期 之 后 这 个 数据 才 变 得 在 R2 中 可 用 。 这 就 是 从 第 一 条 指令 到 第 二 及 第 五 条 
指令 的 边 的 标号 为 2 的 原因 , 这 两 条 指令 都 需 
要 R2 中 的 值 。 类 似 地 ,从 第 三 条 指令 到 第 四 
条 指令 的 边 也 有 标号 表明 延 时 为 2; 第 四 条 指 ， 
令 需 要 被 加 载 到 R3 中 的 值 ,而 这 个 值 要 在 第 


数据 依赖 关系 资源 预约 表 


alu mem 













三 条 指令 开始 之 后 两 个 时 钟 周 期 才 变 得 可 用 。 
因为 我 们 不 知道 RL 和 R7 的 值 之 间 有 什 2 
么 样 的 关系 , 所 以 不 得 不 考虑 地 址 8(R1) 和 地 
址 0(R1) 相 同 的 可 能 性 。 也 就 是 说 , 最 后 一 条 
指令 可 能 正在 把 值 保存 到 第 三 条 指令 读 取 数 
据 的 位 置 。 我 们 正 使 用 的 机 器 模型 允许 我 们 ERTA 
在 从 某 个 位 置 开 始 读 取 数据 的 一 个 时 钟 周 期 
之 后 把 数据 存放 到 这 个 位 置 上 ， 即 使 被 读 出 的 bid 
数据 需要 再 等 一 个 时 钟 周期 才 出 现在 寄存 器 
中 。 这 就 是 从 第 三 条 指令 到 最 后 一 条 指令 的 
边 的 标号 为 1 的 原因 。 这 也 同样 是 从 第 一 条 
指令 到 最 后 一 条 指令 有 一 条 标号 为 1 的 边 的 er a 
原因 。 其 他 标号 为 1 的 边 产生 的 原因 是 指令 图 107， 例 10. 6 的 数据 依赖 图 
间 的 数据 依赖 关系 , 或 者 当 RT 取 某 些 值 时 可 
能 产生 的 依赖 关系 。 口 
10.3.2 ， 基 本 块 的 列表 调度 方法 

基本 块 调度 的 最 简单 的 方法 是 以 “ 带 有 优先 级 的 拓扑 排序 "访问 数据 依赖 图 的 各 个 结 点 。 因 
为 一 个 数据 依赖 图 中 不 可 能 有 环 , 因此 总 是 至 少 存在 一 个 各 个 结 点 之 间 的 拓扑 顺序 。 但 是 , 在 所 
有 可 能 的 拓扑 排序 中 , 有 些 排序 可 能 比 其 他 排序 更 好 。 我 们 将 在 10. 3. 3 节 中 讨论 选择 拓扑 排序 
的 一 些 策略 。 但 是 现在 我 们 仅仅 假设 存在 某 种 算法 来 选择 一 个 较 好 的 拓扑 排序 。 

下 面 我 们 将 讨论 的 列表 调度 算法 按照 被 选中 的 带 优先 级 的 拓扑 排序 访问 各 个 结 点 。 最 后 ， 
这 些 结 点 并 不 一 定 按照 它们 被 访问 的 顺序 进行 调度 。 但 是 指令 被 尽 可 能 早 地 放置 在 调度 方案 中 ， 
因此 指令 被 调度 的 顺序 往往 和 它们 被 访问 的 顺序 差不多 。 

更 详细 地 讲 , 算法 根据 每 个 结 点 和 之 前 已 调度 的 结 点 之 间 的 数据 依赖 约束 , 计算 出 能 够 执行 
该 结 点 的 最 早 时 间 位 置 。 然 后 ,算法 根据 一 个 资源 预约 表 来 检验 该 结 点 所 需要 的 资源 是 否 得 到 
满足 。 这 个 资源 预约 表 收集 了 至 今 已 经 分 配 出 去 的 资源 的 信息 。 该 结 点 被 安排 在 最 早 的 能 够 获 
得 足够 资源 的 时 间 位 置 上 。 
对 一 个 基本 块 进行 列表 调度 

输入 : 一 个 机 器 -资源 向 量 R=[ri ,ry,…], 其 中 m 是 第 i 种 资源 的 可 用 单元 的 数目 ; 一 个 数 
据 依赖 图 C = (N,E) 。N 中 的 每 个 运算 nw 的 标号 是 它 的 资源 预约 表 RT,; 已 中 的 每 个 边 e= mi 一 ma 
都 有 标号 de, RIT ny 不 能 在 ni 执行 之 后 的 d 个 时 钟 周期 之 内 执行 。 

输出 : 一 个 调度 方案 5。 它 把 NN 中 的 每 个 运算 映射 到 时 间 位 置 中 。 各 个 运算 在 方案 所 确定 的 
时 间 位 置 开 始 执行 ,就 可 以 保证 所 有 的 数据 依赖 关系 和 资源 约束 都 得 到 满足 。 
方法 : 执行 图 10-8 中 的 程序 。 关 于 什么 是 “ 带 优先 级 的 拓扑 排序 ”的 讨论 将 在 10. 3.3 节 中 
给 出 。 


je SPAT ik ba 





RT = 一 个 空 的 资源 预约 表 ; 
.| for (按照 带 优先 级 的 拓扑 排序 访问 N 中 的 每 个 结 点 n) { 
3 = MaXe=p—n in E(S(p) + de); 
/* 根据 一 个 指令 的 各 个 前 驱 在 何 时 开始 ， 
计算 这 个 指令 最 早 可 以 在 何 时 开始 */ 
while (存在 i 使 得 RT[s + i] + RT,[i] > R) 
s=s+1; 


/* 进一步 把 这 个 指令 后 延 ， 直 到 所 需 资源 
都 变 得 可 用 为 止 */ 


S(ny =s; 
for (所 有 人 
RT[s +i] = RT[s + i] + RT,[i] 





图 10-8 一 个 列表 指令 调度 算法 


10. 3. 3 ” 带 优先 级 的 拓扑 排序 
列表 调度 算法 不 会 回溯 它 对 每 个 结 点 进行 一 次 且 只 进行 二 次 指令 调度 4 它 使 用 一 个 启发 
式 的 优先 级 函数 来 从 已 经 就 绪 的 结 点 中 选择 下 一 个 调度 的 结 点 。 下 面 是 一 些 关于 结 点 的 所 有 可 
能 的 带 优先 级 的 拓扑 排序 的 性 质 : 
。 如 果 不 考 虑 资源 约束 , 最 短 的 调度 方案 可 以 根据 关键 路 径 ( ciitical path) 给 出 。 所 谓 关键 
路 径 就 是 数据 依赖 图 中 的 最 长 路 径 。 一 个 可 以 被 用 作 优 先 级 函数 的 度量 是 结 点 的 高 度 
(height) ， 就 是 从 这 个 结 点 开始 的 最 长 路 径 的 长 度 。 
。 从 另 一 方面 考虑 , 如 果 所 有 的 运算 都 是 独立 的 ,那么 调度 方案 的 长 度 受到 可 用 资源 的 约 
束 。 关 键 资 源 就 是 具有 最 大 的 资源 使 用 /可 用 数量 比值 的 资源 。 所 谓 资源 使 用 /可 用 数量 
比值 是 指 对 资源 的 使 用 和 可 用 资源 的 单元 数目 的 比值 。 使 用 较 多 关键 资源 的 运算 具有 较 
高 的 优先 级 。 
。 最 后 , 我 们 可 以 使 用 源 代码 中 的 顺序 来 解决 运算 之 间 难 分 先后 的 问题 , 在 源 程序 中 先 出 
现 的 运算 应 该 首先 被 安排 。 
DEJ HTA 中 的 数据 依赖 关系 , 它 的 关键 路 径 的 (包含 了 执行 最 后 一 条 指令 的 时 间 ) 
长 度 是 6 个 时 钟 周期 。 也 就 是 说 , 关键 路 径 是 最 后 的 五 个 结 点 , 从 R3 的 加 载运 算 开始 到 对 R7 的 
保存 运算 结束 。 这 条 路 径 中 的 所 有 边 上 PS cir EE 
的 总 延 时 是 5, 此 外 我 们 还 要 再 加 上 执 ale 
行 最 后 一 条 指令 所 需 的 1 个 时 钟 周期 。 em 
使 用 结 点 高 度 作为 优先 级 函数 , 算 
法 10.7 找到 了 一 个 如 图 10-9 所 示 的 优 
化 的 调度 方案 。 请 注意 , 因为 R3 的 加 
载 具 有 最 大 的 高 度 , 因此 安排 这 条 指令 
首先 执行 。R3 和 R4 的 加 法 在 第 二 个 
时 钟 周期 就 有 足够 的 资源 , 但 是 一 条 加 
载 指令 有 2 个 时 钟 周期 的 延 时 , 因此 我 ” 图 10-9 将 列表 调度 算法 应 用 到 图 1027 后 得 到 的 结果 
们 把 这 个 加 法 安排 到 第 三 个 时 钟 周期 。 也 就 是 说 , 在 第 3 个 时 钟 周期 开始 之 前 我 们 不 能 保证 R 
中 已 经 保存 了 需要 的 值 。 口 
10.3.4 10.3 节 的 练习 
练习 10. 3. 1: 对 于 图 10-10 中 的 每 个 代码 片段 , 画 出 数据 依赖 图 。 








LD R3,8(R1) 






LD R2,0(R1) 









ADD R3,R3,R4 





ADD R3,R3,R2|ST 4(R1),R2 





ST 12(R1),R3 








ST 0(R7),R7 
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LDIRLY a 
LD R2, b 
SUB R3, R1, R2 
ADD R2, R1, R2 
ST a, R3 
ST|b, R2 





a) 


LD Ri, a 
LD R2, b 
SUB Ri, R1, R2 


ADD R2, R1, R2 
ST.a, Ri 
ST by RB 





b) 





LD. Ri, a 
LD R2, b 
SUB R3, R1, R2 
ADD R4, R1, R2 


ST a, R3 
ST b, R4 


图 10-10 #3 10.3.1 的 机 器 代码 


练习 10.3.2: 假设 一 个 机 器 具有 一 个 ALU 资源 (用 于 ADD 和 SUB 运算 ) 和 一 个 MEM 资源 
(用 于 LD 和 sT 运算 )。 假 设 除了 LD 运算 需要 两 个 时 钟 周期 之 外 , 其余 所 有 运算 都 只 需要 一 个 
时 钟 周期 。 但 是 , 如 例 10. 6 中 所 说 , 在 一 个 对 某 内 存 位 置 的 LD 运算 执行 一 个 时 钟 周期 之 后 就 可 
以 执行 对 同一 个 位 置 的 ST 运算 。 为 图 10-10 中 的 每 个 代码 片断 寻找 一 个 最 短 调度 方案 。 

练习 10.3.3: 在 如 下 假设 下 重复 练习 10. 3. 2。 

1) 该 机 器 具有 三 个 ALU 资源 和 两 个 MEM 资源 。 

2) 该 机 器 具有 两 个 ALU 资源 和 一 个 MEM 资源 。 

3) 该 机 器 具有 两 个 ALU 资源 和 两 个 MEM 资源 。 

练习 10.3.4: 使 用 例 10.6 中 的 机 器 模型 (和 练习 10.3.2 一 
样 ): 
1) 为 图 10-11 中 的 代码 画 出 数据 依赖 图 。 
2) 对 于 问题 (1) 得 到 的 数据 依赖 图 , 全 部 关键 路 径 包 括 哪些 ? 图 10-11 练习 10.3.4 的 
3) 假设 有 无 限 多 个 MEM 资源 , 对 于 这 七 条 指令 的 所 有 可 能 的 机 器 代码 
调度 方案 是 什么 ? 


10.4 全 局 代码 调度 


对 于 一 个 具有 中 等 数量 的 指令 并 行 机 制 的 机 器 , 通过 压缩 各 个 基本 块 而 得 到 的 调度 方案 往 
往 会 留 下 很 多 空闲 的 资源 。 为 了 更 好 地 利用 机 器 资源 ,有 必要 考虑 把 一 些 指令 从 一 个 基本 块 移 
动 到 另 一 个 基本 块 的 代码 生成 策略 。 同 时 考虑 多 个 基本 块 的 策略 称 为 全 局 调度 ( global schedu- 
ling) 算法。 为 了 正确 地 进行 全 局 调度 , 我 们 需要 考虑 的 问题 不 仅 包括 数据 依赖 关系 , 还 包括 控制 
依赖 。 我 们 必须 保证 

1) 所 有 在 原 程序 中 执行 的 指令 都 会 在 优化 后 的 程序 中 运行 ,并 且 

2 ) 虽然 优化 后 的 程序 可 以 投机 性 地 执行 一 些 额外 指令 , 但 这 些 指令 不 能 产生 任何 有 害 的 副作用 。 
10.4.1 基本 的 代码 移动 

让 我 们 首先 通过 一 个 简单 的 例子 来 研究 一 下 指令 移动 可 能 涉及 的 问题 。 
i) 10. 9 候 设 我 们 有 一 个 可 以 在 单个 时 钟 周期 内 同时 执行 任意 两 条 指令 的 机 器 。 除 了 加 载运 
算 有 两 个 时 钟 周期 的 延 时 外 ， 其余 每 个 运算 的 执行 延 时 为 一 个 时 钟 周期 。 为 简单 起 见 , 我 们 假设 
例子 中 所 有 的 内 存 访问 都 是 正确 的 , 且 访 问 的 数据 都 在 高 速 缓存 中 。 图 10-12a 显示 了 一 个 包括 
三 个 基本 块 的 简单 流 图 。 其 中 的 代码 被 扩展 为 图 10-12b 所 示 的 机 器 指令 。 因 为 数据 依赖 关系 ， 
每 个 基本 块 中 的 所 有 指令 必须 顺序 执行 。 实际 上 , 每 个 基本 块 中 都 必须 插入 一 个 no-op 指令 。 

BUE ab c d 和 。 的 地 址 互 不 相同 , 并 且 这 些 地 址 被 分 别 存放 在 寄存 器 RI ~ R5 中 。 因 
此 不 同 基本 块 中 的 计算 之 间 没 有 数据 依赖 关系 。 我 们 发 现 , 不 管 是 否 选择 图 中 的 分 支 跳 转 , 基本 
th B, 中 的 所 有 运算 都 会 被 执行 , 因此 它 可 以 和 基本 块 B, 中 的 运算 并 行 执行 。 我 们 不 能 把 Bi 中 
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的 运算 移动 到 B3，, 因为 需要 它们 来 决定 分 支 跳 转 的 出 口 。 





LD R6,0(R1) 
nop 
BEQZ R6,L 


LD R7,0(R2) 

nop 

ST 0(R3),R7 
B3 


:| ID R8,0(R4) 
nop 
ADD R8,R8,R8 








Bz 









if (a==0) goto L 











L: ST 0(R5),R8 
| e= dtd 
a) 源 程序 b) 局 部 调度 得 到 的 机 器 代码 





B 
LD R6,0(R1), LD R8,0(R4) z 
LD R7,0(R2) 
ADD R8,R8,R8, BEQZ R6,L 








L: B , 
ST 0(R5),R8 |? | st 0(R5),R8, ST 0(R3) ,R7| 
c) 全 局 调度 得 到 的 机 器 代码 


图 10-12 例 10.9 中 全 局 调度 之 前 和 之 后 的 流 图 


B, 中 的 运算 和 基本 块 Bi 中 的 测试 指令 之 间 具 有 控制 依赖 关系 。 我 们 可 以 在 基本 块 B, 中 投 
机 性 执行 Ba 中 的 加 载运 算 而 不 会 产生 任何 附加 开销 , 并 且 只 要 该 分 支 执行 ,就 可 以 节约 两 个 时 
钟 周期 。 

保存 运算 不 应 该 投机 性 地 执行 ,因为 它们 覆 写 了 某 个 内 存 位 置 上 的 原 值 ; :但 是 可 以 延迟 执 
行 一 个 保存 运算 。 我 们 不 能 直接 把 B, 中 的 保存 运算 放 到 基本 块 B 中 , 因为 只 有 当 控制 流 经 过 
基本 块 B, 时 才能 执行 这 个 保存 运算 。 但 是 , 我 们 可 以 把 保存 运算 放 在 B, 的 一 个 拷贝 中 。 
图 10-12e 中 显示 了 经 过 这 样 优化 后 的 调度 方案 。 优 化 后 的 代码 在 4 个 时 钟 周期 内 执行 完毕 , 这 
和 单独 执行 基本 块 B, 所 需 的 时 间 一 样 。 图 

例 10. 9 表明 我 们 可 以 沿 着 一 个 执行 路 径 上 下 移动 指令 。 在 这 个 例子 中 , 每 一 对 基本 块 都 有 
一 个 不 同 的 “支配 关系 ”, 因此 关于 何 时 以 及 如 何在 每 一 对 基本 块 之 间 移 动 指 令 的 考虑 是 不 同 的 。 
如 9.6. 1 节 中 所 讨论 的 , 如 果 每 一 个 从 控制 流 图 人 口 处 到 达 基 本 块 B' 的 路 径 都 经 过 一 个 基本 块 
B, 那么 就 认为 如 支配 B'。 类 似 地 , 如 果 从 B' 到 达 流 图 出 口 处 的 路 径 都 经 过 B, RINA B 反 向 支 
配 (postdominate)B'。 当 B 支 配 B' 并 且 B' 反 向 支配 B 的 时 候 , 我 们 就 说 B 和 B' 是 控制 等 价 的 
(control equivalent) , 其 含义 是 一 个 基本 块 会 被 执行 当 且 仅 当 另 一 个 基本 块 也 会 被 执行 。 对 于 图 
10-12 中 的 例子 , 假设 B, 是 流 图 人 口 , 且 Bs 是 出 口 , 则 

1) Bi 和 Bs 是 控制 等 价 的 : Bi 支配 B, 而 Bs 反 向 支配 .Bi 。 

2) Bi 支配 B,, 但 是 By 不 反 向 支配 Bo 

3) By 不 支配 B, 但 是 B, 反 向 支配 B, 。 

在 一 条 路 径 上 的 一 对 基本 块 之 间 也 可 能 既 不 具有 支配 关系 , 也 不 具有 反 向 支配 关系 。 
10.4.2 向 上 的 代码 移动 

我 们 现在 仔细 考查 把 一 个 运算 沿 着 一 条 路 径 向 上 移动 意味 着 什么 。 假设 我 们 希望 把 一 个 运 
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算 从 基本 块 sre 沿 着 一 条 控制 流 路 径 向 上 移动 到 基本 块 'wi。 同时 假设 这 样 的 移动 没有 违反 任何 
数据 依赖 关系 , 并 且 使 得 从 dst 到 sre 的 路 径 运行 得 更 快 。 如 果 dst 支配 src 并 且 sre 反 向 支配 dst, 
那么 被 移动 的 运算 会 在 它 应 该 运行 的 时 候 被 恰好 运行 一 次 。 

如 果 src 不 反 向 支配 dst 

这 种 情况 下 , 存在 一 条 经 过 ds 但 是 没有 到 达 sre 的 路 径 。 此 时 会 执行 一 个 多 余 的 运算 。 除 
非 被 移动 的 运算 没有 任何 有 害 的 副作用 , 否则 这 个 代码 移动 就 是 非法 的 。 如 果 被 移动 的 运算 是 
“免费 ”执行 的 ( 即 它 只 使 用 那些 本 来 会 被 闲置 的 资源 ) , 那么 这 次 代码 移动 没有 产生 开销 。 只 有 
当 控制 流 到 达 sre 的 时 候 这 次 代码 移动 才 是 有 益 的 。 

如 果 dst 不 支配 Src 

这 种 情况 下 存在 一 条 没有 首先 经 过 ds 就 到 达 sre 的 路 径 。 我 们 需要 在 这 样 的 路 径 中 插 人 被 
移动 运算 的 拷贝 。 根 据 9. 5 节 中 对 部 分 宛 余 消除 的 讨论 我 们 可 以 知道 如 何 准确 做 到 这 一 点 。 我 
们 把 这 个 运算 的 拷贝 放置 在 一 组 基本 块 中 , 这 组 基本 块 形成 了 一 个 将 人 口 基本 块 和 sre 分 割 开 的 
割 集 。 在 每 个 插入 这 个 拷贝 的 地 方 , 下 列 约束 必须 满足 : 

1) 该 运算 的 运算 分 量 必须 和 原 运 算 的 运算 分 量具 有 相同 的 值 。 

2) 运算 的 结果 没有 覆盖 掉 可 能 在 后 面 使 用 的 值 。 

3) 此 运算 本 身 的 结果 没有 在 到 达 sre 之 前 被 覆盖 掉 。 

这 些 拷贝 使 得 sre 中 的 原 指 令 完全 宛 余 ， 因 此 可 以 被 消除 。 

我 们 把 这 个 运算 指令 的 额外 拷贝 称 为 补偿 代码 (compen sation code) 。9.5 节 讨 论 过 , 可 以 在 
关键 边 上 插入 基本 块 来 放置 这 些 拷 贝 。 补 偿 代码 可 能 使 得 某 些 路 径 的 执行 变 慢 。 因 此 , RAY 
被 优化 路 径 的 执行 频率 高 于 其 他 未 被 优化 的 路 径 时 , 这 个 代码 移动 才 会 提高 程序 执行 的 性 能 。 
10.4.3 向 下 的 代码 移动 

假设 我 们 感 兴趣 的 是 把 一 个 运算 从 基本 块 sre 沿 着 一 条 控制 流 路 径 向 下 移动 到 基本 块 dst。 
我 们 可 以 像 上 面 介 绍 的 那样 考虑 这 样 的 代码 移动 。 

如 果 src 不 支配 dst 

在 这 种 情况 下 , 存在 一 条 没有 先 访问 sre 就 到 达 dst 的 路 径 。 同 样 , 在 这 种 情况 下 会 执行 一 个 
额外 的 运算 。 遗 憾 的 是 ,向 下 代码 移动 经 常用 于 写 运 算 。 这 种 运算 具有 副作用 , 会 覆盖 原来 的 
Ho 我 们 可 以 设法 绕 过 这 个 问题 , 方法 是 复制 从 sre 到 dst 的 路 径 上 的 基本 块 , 并 且 只 在 dsi 的 新 
拷贝 中 放置 这 个 运算 。 男 一 个 方法 是 , 如果 可 以 在 使 用 带 断 言 的 指令 时 使 用 这 种 指令 。 我 们 用 
基本 块 sro 的 卫 式 断言 作为 被 移动 运算 的 卫 式 断言 。 请 注意 , 这 些 带 断言 的 指令 只 能 被 安排 在 由 
计算 该 断言 的 基本 块 所 支配 的 基本 块 中 , 否则 该 断言 的 值 会 不 可 用 。 

如 果 dst 不 反 向 支配 sre 

“和 上 面 的 讨论 一 样 , 我 们 必须 插入 补偿 代码 以 使 得 被 移动 的 运算 在 所 有 没有 到 达 dst 的 路 径 
上 都 被 执行 了 。 这 个 转换 仍然 和 部 分 元 余 消 除 类 似 , 不 同 之 处 在 于 运算 的 拷贝 被 放置 在 基本 块 
sre 之 后 、 把 sre 和 流 图 出 口 处 分 开 的 割 集中 。 

关于 向 上 和 向 下 代码 移动 的 总 结 

从 上 面 的 讨论 中 可 知 , 我 们 看 到 存在 一 组 可 能 的 全 局 代码 移动 的 方法 。 这 些 方法 的 收益 、 代 
价 以 及 实现 复杂 度 各 不 相同 。 图 10-13 中 给 出 了 这 些 代码 移动 方法 的 总 结 。 图 中 的 各 行 对 应 于 下 
面 四 种 情况 : 

1) 在 控制 等 价 的 基本 块 之 间 移 动 指 令 最 简单 且 性 价 比 最 高 。 不 需要 执行 额外 的 运算 , 也 不 
需要 补偿 代码 。 

2) 在 向 上 (向 下 ) 代 码 移动 中 ,如 果 源 基本 块 不 反 向 支配 (支配 ) 目标 基本 块 , 那么 就 可 能 需 
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要 执行 额外 的 运算 。 当 该 额外 运算 能 够 免费 执行 并 且 通过 源 基本 块 的 路 径 被 执行 时 ， 这 个 代码 
移动 就 是 有 益 的 。 

3) 在 向 上 (向 下 ) 代 码 移 动 中 ， 如 果 目 标 基本 块 不 支配 ( 反 向 支配 ) 源 基本 块 ， 就 需要 补偿 代 
码 。 带 有 补偿 代码 的 路 径 的 运行 可 能 会 变 慢 , 因此 保证 被 优化 的 路 径 具 有 和 较 高 的 执行 频率 是 很 
重要 的 。 

4) 最 后 一 种 情况 把 第 二 和 第 三 种 情况 的 不 利之 处 合并 了 起 来 : 可 能 既 需 要 执行 额外 运算 ， 
又 需要 补偿 代码 。 
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图 10-13 ”代码 移动 的 总 结 


10.4.4 更 新 数据 依赖 关系 

如 下 面 的 例 10. 10 所 示 , 代码 移动 可 能 会 改变 运算 之 间 的 数据 依赖 关系 。 因 此 在 每 次 代码 移 
动 之 后 都 必须 更 新 数据 依赖 关系 。 
对 于 图 10-14 中 显示 的 流 图 , 对 » 的 两 个 赋值 
之 一 可 以 被 向 上 移动 到 顶部 的 基本 块 , 因为 这 样 的 转换 保 
持 了 原 程序 中 的 所 有 依赖 关系 。 但 是 ,一 但 我 们 把 其 中 一 
个 赋值 语句 上 移 ， 就 不 能 再 移动 另 一 个 。 更 明确 地 说 , 我 A 
们 看 到 在 代码 移动 之 前 顶部 的 基本 块 的 出 口 处 * 是 不 活路 
的 ,但 是 在 移动 之 后 就 变 得 活跃 了。 如果 一 个 变量 在 一 个 ”图 10-14 “说 明 因为 代码 移动 而 改变 





程序 点 上 活跃 , 那么 我 们 不 能 把 对 该 变量 的 投机 性 定 值 移 数据 依赖 关系 的 例子 
动 到 该 程序 点 的 前 面 。 E] 


10.4.5 .全 局 调度 算法 

在 上 一 节 中 , 我 们 看 到 代码 移动 对 某 些 路 径 有 益 , 但 
是 会 损害 另外 一 些 路 径 的 性 能 。 好 消息 是 指令 并 不 是 生 而 平等 的 。 实 际 上 , 我 们 知道 ; 一 个 程序 
的 90% 以 上 的 执行 时 间 被 花 在 不 到 10% 的 代码 上 。 因 此 , 我 们 可 以 把 目标 确定 为 使 得 频繁 执行 
的 路 径 更 快运 行 , 虽然 有 可 能 降低 不 频繁 路 径 的 运行 速度 。 

编译 器 有 多 种 技术 来 估算 执行 频率 。 我 们 有 理由 假设 在 最 内 层 的 循环 中 的 指令 比 外 层 循环 
中 的 指令 执行 得 更 频繁 , 也 有 理由 假设 选择 向 回 跳 转 分 支 的 使 用 频率 高 过 不 选择 这 个 分 支 的 使 
用 频率 。 另 外 , 转向 程序 出 口 或 者 异常 处 理 例 程 的 分 支 不 大 可 能 被 选择 执行 。 但 是 , 最 好 的 频率 
估算 来 自 于 动态 获取 的 程序 运行 剖面 。 在 这 个 技术 中 , 程序 经 过 插 装 以 记录 程序 运行 时 刻 各 个 
条 件 分 支 的 出 口 选择 情况 。 然 后 , 程序 就 在 有 代表 性 的 输入 上 运行 , 确定 程序 总 体 的 运行 行为 。 
人 们 发 现 应 用 这 个 技术 得 到 的 结果 相当 精确 。 这 样 的 信息 可 以 反馈 给 编译 器 , 由 编译 器 在 其 优 
化 过 程 中 使 用 。 

基于 区 域 的 调度 

现在 我 们 描述 一 个 简单 的 全 局 调度 器 , 它 支 持 两 种 最 容易 的 代码 移动 : 

1) 把 运算 向 上 移动 到 控制 等 价 的 基本 块 。 
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2) 把 运算 向 上 移动 一 个 分 支 , 移动 到 一 个 支配 前 驱 中 。 

9.7.1 节 介 绍 过 , 一 个 区 域 是 一 个 控制 流 图 的 子 集 , 它 只 能 通过 一 个 人 口 基 本 块 到 达 。 RN 
可 以 把 任何 过 程 表示 为 一 个 区 域 的 层次 结构 。 顶 层 区 域 包 括 整 个 过 程 , 而 嵌 套 在 其 中 的 子 区 域 
代表 该 过 程 中 的 自然 循环 。 我 们 假设 控制 流 图 是 可 归 约 的 。 


基于 区 域 的 调度 。 
输入 : 一 个 控制 流 图 和 一 个 机 器 - 资源 描述 。 
输出 : 一 个 调度 方案 5。 它 把 每 条 指令 映射 到 一 个 基本 块 和 一 个 时 间 位 置 。 
方法 : 执行 图 10-15 中 的 程序 。 其 中 的 一 些 术语 缩写 的 含义 是 很 明显 的 : ControlEquiv( 8) 表示 


和 基本 块 B 控制 等 价 的 基本 块 的 集 
合 , 而 作用 于 一 个 基本 块 集合 的 for (按照 拓扑 排序 访问 各 个 区 域 尽 ， 使 得 内 层 区 域 先 于 














i 外 层 区 域 被 访问 ) 
DominatedSuce 表示 下 面 的 基本 块 集 { 计 算数 据 依赖 关系 ; 2 
or Hg 级 的 ila A) 
a eneas | GORGE ay eS eee) 
个 基本 块 的 后 继 , 且 被 该 集合 中 的 所 i kana T 
‘andInsts = CandBlocks A i! 和 指令; 
有 基本 块 支配 。 for (t= 二 0,1,... HIB i df 
算法 10. 11 中 的 代码 调度 从 最 内 for (按照 优先 顺序 访问 CandInsts 中 的 每 个 指令 ) 
层 的 区 域 开始 逐渐 扩展 到 最 外 层 。 Be i T 
在 对 一 个 区 域 进行 调度 时 , 每 一 个 内 更 新 已 分 配 资源 的 信息 ; 
更 新 数据 依赖 关系 ; 
PRA KAR SE TRE. 指 } 
令 不 能 移 人 或 移出 某 个 子 区 域 。 但 ) 更 新 CandInsts; 
是 , 只 要 指令 的 数据 依赖 关系 和 控制 
依赖 关系 都 得 到 满足 , 我 们 可 以 绕 着 
子 区 域 移 动 这 些 指 令 。 : 
图 10-15 一 个 基于 区 域 的 全 局 调度 算法 
算法 忽略 了 所 有 流 回 区 域 头 基 


本 块 的 控制 和 依赖 边 , 因此 最 后 得 到 的 控制 流 和 数据 依赖 图 都 是 无 环 的 。 对 每 个 区 域 中 的 各 基 
本 块 的 访问 遵守 拓扑 排序 。 这 个 顺序 保证 了 只 有 在 该 基本 块 所 依赖 的 所 有 指令 都 被 调度 好 之 后 
才 对 这 个 基本 块 进行 调度 。 将 被 安排 在 一 个 基本 块 B 中 的 指令 来 自 于 所 有 和 基本 块 B 控制 等 价 
的 基本 块 (包含 B), 以 及 这 些 等 价 基本 块 的 .被 B 支 配 的 直接 后 继 。 

为 各 个 基本 块 创建 调度 方案 时 使 用 的 是 列表 调度 算法 。 该 算法 有 一 个 候选 指令 列表 CandIn- 
sts, 这 个 列表 中 包含 了 候选 基本 块 中 的 所 有 其 前 驱 已 调度 好 的 指令 。 该 算法 逐个 时 钟 周期 地 构造 
调度 方案 。 对 于 每 个 时 钟 周期 , 它 按照 优先 级 顺序 检查 CandInsts 中 的 各 条 指令 , 在 资源 允许 的 
情况 下 把 指令 安排 在 该 时 钟 周 期 上 。 然 后 , 算法 10. 11 更 新 Candinsts 并 重复 这 个 过 程 , 直到 B 中 
所 有 指令 都 被 安排 完毕 。 

CandInsts 中 的 指令 的 优先 级 顺序 所 使 用 的 优先 级 函数 和 10.3 节 中 讨论 过 的 函数 类 似 。 然 
m, 我 们 作 了 一 个 重要 的 修改 。 我 们 把 较 高 的 优先 级 赋予 那些 来 自 和 基本 块 B 控制 等 价 的 基本 
块 的 指令 , 而 对 来 自 于 后 继 基 本 块 的 指令 赋予 较 低 的 优先 级 。 这 么 做 的 原因 是 后 一 种 类 型 的 指 
令 只 是 在 基本 块 B 中 被 投机 性 执行 。 四 

循环 展开 

在 基于 区 域 的 调度 中 , 一 个 循环 中 迭代 之 间 的 界限 是 代码 移动 的 障碍 。 来 自 一 个 迭代 的 运 
算 不 能 和 来 自 其 他 迭代 的 运算 重 玲 。 可 缓解 这 一 问题 的 简单 且 高 效 的 技术 是 在 代码 调度 之 前 少 
量 地 展开 该 循环 。 如 下 的 for 循环 
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for G = 0: i <N; i++) 4 
SG); for (i = 0; i+4 < N; i+=4) { 






repeat { 











SCY? S; 
可 以 被 写成 图 10-16a 所 示 的 代码 。 p x (C) break; 
S(i+2); ; 
类 似 地 , 如 下 的 repeat 循环 SCEI if (C) break; 
repeat } S; 
S; for Ce: i < Nade) t if (C) break; 
until C; Stil; ; 
可 以 被 写成 图 10-16b 所 示 的 代码 。 |? aiii 
循环 展开 在 循环 体 中 产生 了 更 多 a) 展开 一 个 for 循 环 b) 展开 一 个 repeat 循 环 
» 今 ay Pik y 
的 指令 ， 使 全 局 调度 算法 找到 更 多 Ne 
的 并 行 性 。 


相 邻 压缩 

算法 10. 11 只 支持 10.4.1 节 中 描述 的 前 两 种 形式 的 代码 移动 。 需 要 引入 补偿 代码 的 代码 移 
动 有 时 也 是 有 用 的 。 支 持 这 种 代码 移动 的 方法 之 一 是 在 基于 区 域 的 调度 之 后 再 跟 一 个 简单 的 处 
理 过 程 。 在 这 个 过 程 中 , 我 们 可 以 检查 各 对 连续 执行 的 基本 块 , 检查 是 否 有 运算 可 以 在 它们 之 间 
上 移 或 下 移 ， 以 改进 这 些 基 本 块 的 执行 时 间 。 如 果 找 到 了 一 对 这 样 的 基本 块 , 我 们 检查 是 否 需要 
在 别 的 路 径 中 复制 将 被 移动 的 指令 。 如 果 移 动 之 后 的 预期 收益 是 正 的 , 就 可 以 进行 这 样 的 代码 
移动 。 

这 个 简单 的 扩展 能 够 有 效 提高 循环 的 性 能 。 比 如 , 它 可 以 把 一 个 迭代 开始 处 的 运算 移动 到 
上 一 个 迭代 的 结尾 , 同样 也 可 以 把 运算 从 第 一 个 迭代 移动 到 循环 之 外 。 对 于 较 紧 密 的 循环 ， 即 每 
个 迭代 过 程 只 执行 少量 指令 的 循环 , 这 种 优化 特别 具有 吸引 力 。 但 是 , 由 于 每 个 代码 移动 的 决定 
是 局 部 地 独立 做 出 的 , 因此 这 个 技术 的 效果 受到 一 定 的 限制 。 

10.4.6 高 级 代码 移动 技术 

如 果 我 们 的 目标 机 器 是 静态 调度 的 , 并 且 具 有 丰富 的 指令 级 并 行 机 制 , 我 们 可 能 需要 更 加 积 
极 的 调度 算法 。 下 面 是 有 关 进 一 步 扩展 代码 移动 技术 的 一 些 高 级 描述 : 

1) 为 了 便于 进行 下 面 的 扩展 , 我 们 可 以 在 那些 从 具有 多 个 前 驱 的 基本 块 出 发 的 控制 流 边 上 
增加 新 的 基本 块 。 在 代码 调度 结束 后 将 删除 这 些 基 本 块 中 的 空 基 本 块 。 一 个 有 用 的 启发 式 规则 
是 试图 把 指令 移出 几乎 为 空 的 基本 块 , 使 得 这 个 基本 块 可 以 被 完全 删除 。 

2) 在 算法 10.11 中 , 各 基本 块 内 执行 的 代码 在 此 基本 块 被 访问 时 一 次 性 调度 完毕 。 这 个 简 
单 的 方法 已 经 足够 了 , 因为 这 个 算法 只 能 够 把 运算 上 移 到 前 面 的 支配 基本 块 。 为 了 进行 需要 额 
外 补偿 代码 的 代码 移动 ,我们 选用 了 一 个 略微 不 同 的 方法 。 当 我 们 访问 基本 块 B 的 时 候 , 只 对 B 
以 及 和 8 控制 等 价 的 基本 块 中 的 指令 进行 调度 。 我 们 首先 试图 把 这 些 指令 放置 到 之 前 已 经 被 访 
问 过 的 前 驱 基 本 块 中 。 这 些 基本 块 已 经 有 了 一 个 部 分 调度 方案 。 我 们 试图 找到 一 个 目标 基本 块 ， 
使 得 移动 后 可 以 改进 一 个 频繁 执行 的 路 径 , 然后 在 其 他 路 径 上 放置 这 条 指令 的 拷贝 来 保证 移动 
的 正确 性 。 如 果 指 令 不 能 向 上 移动 , 那么 它们 和 以 前 一 样 在 当前 的 基本 块 中 进行 调度 。 

3) 在 以 拓扑 顺序 访问 基本 块 的 算法 中 , 实现 向 下 的 代码 移动 要 更 加 困难 一 些 , 原因 是 目标 
基本 块 还 在 等 待 调度 。 昌 然 机 会 较 少 , 但 还 是 存在 一 些 机 会 进行 这 样 的 代码 移动 。 我 们 会 移动 
所 有 同时 满足 下 列 条 件 的 运算 ; 

D 它们 可 以 被 移动 。 

D 在 原来 的 基本 块 中 它们 不 能 免费 执行 。 

如 果 目 标 机 器 有 很 多 没有 使 用 到 的 硬件 资源 , 这 个 简单 的 策略 会 很 有 效 。 
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10.4.7 ”和 动态 调度 器 的 交互 

一 个 动态 调度 器 的 优势 是 它 可 以 根据 运行 时 刻 的 情况 产生 新 的 调度 方案 , 而 不 必 在 运行 之 
前 对 所 有 可 能 的 调度 进行 编码 。 如 果 目 标 机 器 有 一 个 动态 调度 器 , 那么 静态 调度 器 的 主要 功能 
是 保证 尽早 获得 高 延 时 指令 , 使 得 动态 调度 器 可 以 尽早 发 出 这 些 指令 。 

高 速 缓 存 脱 靶 是 一 类 不 可 预测 的 事件 , 它们 可 能 使 得 程序 的 性 能 有 很 大 的 不 同 。 如 果 可 以 使 用 
数据 预 取 指令 , 那么 静态 调度 器 可 以 较 早 地 放置 这 些 预 取 指 令 以 使 得 在 需要 相应 数据 时 , 数据 已 经 
在 高 速 缓 存 之 中 。 静 态 调度 器 通过 这 种 方式 有 效 地 帮助 动态 调度 器 。 如 果 没 有 预 取 指 令 可 用 , 编译 
器 可 以 估算 一 下 哪些 运算 可 能 会 发 生 高 速 缓存 脱 靶 ， 并 试图 早 一 点 发 出 这 些 运算 指令 。 

如 果 在 目标 机 器 上 没有 动态 调度 机 制 , 静态 调度 器 必须 保守 地 处 理 调度 问题 ,把 每 对 具有 数据 依 
赖 关系 的 运算 分 开 , 使 它们 之 间 的 间隔 不 小 于 最 小 延 时 。 但 是 , 如 果 有 动态 调度 器 可 用 , 编译 器 只 需要 
把 具有 数据 依赖 关系 的 运算 指令 按照 正确 的 顺序 排列 ,以 保证 程序 的 正确 性 。 为 了 得 到 最 佳 性 能 , 编 
译 器 应 该 给 较 有 可 能 发 生 的 依赖 赋予 较 长 的 延 时 ,给 不 大 可 能 发 生 的 依赖 赋予 较 短 的 延 时 。 

分 支 的 错误 预测 是 性 能 下 降 的 重要 原因 之 一 。 因 为 错误 预测 会 带 来 较 长 的 时 间 损 失 , 较 少 
执行 路 径 上 的 指令 仍然 会 对 整个 执行 时 间 产 生 较 大 的 影响 。 所 以 , 应 该 给 这 类 指令 赋予 较 高 的 
优先 级 , 以便 降低 错误 预测 的 代价 。 

10.4.8 10.4 节 的 练习 
练习 10. 4. 1: 指出 如 何 展开 一 般 的 while 循环 


while (C) 
Ss 


! 练习 10. 4. 2: 考虑 代码 片断 : 
if (x == 0) a = b; 

else a = cC; 

d a a; 


假设 有 一 个 机 器 使 用 了 例 10. 6 中 的 延 时 模型 ( 即 加 载运 算 需 要 两 个 时 钟 周期 ， 其 他 指令 需 
要 一 个 时 钟 周期 ) 。 同 时 假设 该 机 器 可 以 一 次 执行 任意 两 条 指令 。 为 这 个 片断 找 出 一 个 最 短 的 执 
行 方法 。 不 要 忘记 考虑 在 各 个 复制 步骤 中 使 用 哪个 寄存 器 最 好 。 同 时 , 记 住 利用 8. 6 节 中 描述 的 
寄存 器 描述 符 所 提供 的 信息 , 以 避免 不 必要 的 加 载 和 保存 运算 。 


10.5 软件 流水 线 化 


正如 在 本 章 的 引言 部 分 所 讨论 的 , 数值 应 用 往往 具有 很 大 的 并 行 性 。 特 别 地 , 它们 经 常 含有 
各 次 迭代 之 间 相 互 完 全 独立 的 循环 。 从 并 行 化 的 角度 看 , 这 些 被 称 为 do-all 循环 的 循环 很 有 吸引 
H, 原因 是 它们 的 迭代 可 以 并 行 执行 , 其 加 速 比 和 循环 的 迭代 数目 旦 线性 关系 。 具 有 很 多 迭代 的 
do-all 循环 具有 的 并 行 性 足以 充满 一 个 处 理 器 的 所 有 资源 。 能 否 充 分 利用 循环 中 的 可 用 并 行 性 完 
全 依赖 于 调度 器 的 能 力 。 本 节 描 述 一 个 被 称 为 软件 流水 线 化 (software pipelining) 的 算法 。 它 可 以 
同时 对 整个 循环 进行 调度 , 充分 利用 各 个 迭代 之 间 的 并 行 性 。 
10.5.1 引言 

在 本 节 中 ,我 们 将 使 用 例 10. 12 中 的 do-all 循环 来 解释 软件 流水 线 化 。 我 们 首先 说 明 跨 越 迭 
代 的 调度 极其 重要 , 原因 是 在 单一 迭代 过 程 中 的 运算 之 间 的 并 行 性 相对 较 小 。 然 后 , 我 们 说 明 循 
环 展 开 技术 通过 让 被 展开 迭代 相互 重 和 至 执 行 来 提高 程序 的 性 能 。 但 是 ,被 展开 循环 之 间 的 界限 
仍然 为 代码 移动 设置 了 障碍 , 还 有 很 多 可 改进 性 能 机 会 没有 被 循环 展开 技术 充分 利用 。 另 一 方 
面 ,软件 流水 线 化 技术 将 多 个 连续 的 迭代 持续 地 交 丢 执行 ,直到 所 有 和 迭代 执行 完毕 为 止 。 这 个 技 
术 使 得 软件 流水 线 化 技术 可 以 生成 高 效 紧 凑 的 代码 。 
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FEAR do-all 循环 : 


for G = 0; i < my. i++) 
Diil = ALil*BLi] + c; 


上 面 循 环 中 各 个 迭代 对 不 同 的 内 存 位 置 执行 写 运算 ， 而 这 些 被 写 的 位 置 不 同 于 任何 被 读 的 
位 置 。 因 此 各 个 迭代 之 间 没 有 内 存 依赖 关系 ， 所 有 的 迭代 都 可 以 并 行 地 进行 。 
在 本 节 中 , 我们 选择 下 面 的 模型 作为 目标 机 器 。 在 这 个 模型 中 ， 
。 机 器 可 以 在 同一 个 时 钟 周期 内 发 出 : 一 个 加 载运 算 、 一 个 保存 运算 、 一 个 算术 运算 和 一 个 
分 支 运 算 。 
。 机 器 有 一 个 如 下 形式 的 循环 回归 运算 指令 
BL R. L 
这 个 运算 把 寄存 器 R 的 值 减 一 ， 并且 在 结果 不 为 0 的 情况 下 跳 转 到 位 置 了。 
。 内 存 运 算 有 一 个 自动 加 一 的 寻 址 模式 ,通过 寄存 器 之 后 的 ++ 符号 表示 。 在 每 次 访问 之 
后 , 寄存 器 自动 地 加 一 , 指向 接 下 来 的 一 个 地 址 。 
。 算 术 运 算是 完全 流水 线 化 的 。 每 个 时 钟 周期 可 以 启动 一 个 算术 运算 ， 但 是 结果 要 到 2 个 
时 钟 周期 后 才 可 用 。 所 有 其 他 指令 的 执行 延 时 为 一 个 时 钟 周期 。 
如 果 每 次 只 对 于 个 迭代 进行 调度 , 那么 在 这 个 机 [ 
器 模型 上 得 到 的 最 好 调度 方案 如 图 10-17 所 示 。 该 图 Jea e Pe oi 





中 也 指明 了 一 些 有 关 数据 布局 的 假设 ; 寄存 器 RLR pegs i OVS 

和 R3 存放 数组 4.B 和 DD 的 开始 地 址 , 寄存 器 R4 存放 | | Lp R5, 0(Ri++) 

常量 c，, 而 寄存 器 R10 存放 值 n-1, 这 个 值 在 循环 之 LD R6, 0(R2++) 

外 计算 。 这 个 计算 过 程 大 部 分 是 串 行 的 , 共 需 要 7 个 CE te 

时 钟 周 期 。 只 有 循环 回归 运算 指令 的 执行 和 和 迭代 的 最 ADD R8, R7, R4 

后 一 个 运算 的 执行 重 检 。 口 Kita ee ai eed 








一 般 来 说 , 我 们 可 以 展开 一 个 循环 的 多 个 选 代 来 “， 
获得 较 好 的 硬件 利用 率 。 但 是 这 么 做 会 增加 代码 的 大 ”图 10-17 例 10. 12 的 局 部 调度 代码 
小 ,会 对 程序 的 整体 性 能 产生 负面 影响 。 因 此 , 我 们 必须 选择 一 个 折衷 方 案 , 选择 适当 的 送 代 展 
开 次 数 以 选择 最 大 的 性 能 提升 , 但 是 又 不 能 过 度 扩展 代码 。 下 面 的 例子 解释 了 这 种 折衷 方 案 。 








虽然 在 例 10. 12 中 循环 的 各 个 迭代 内 部 几 p - 
乎 找 不 到 并 行 性 , 但 各 个 先 代 之 间 依然 具有 很 多 并 行 。 | ” 也 

性 。 循 环 展开 技术 把 该 循环 的 多 个 选 代 放 到 一 个 大 基 

本 块 中 , 然后 使 用 一 个 简单 的 列表 调度 算法 来 对 这 些 MOL LD 

运算 进行 调度 , 使 之 并 行 运行 。 如 果 把 我 们 的 例子 中 a i 

的 循环 展开 四 次 并 把 算法 10.7 应 用 于 展开 得 到 的 代 sT MUL LD 

码 , 那么 就 可 以 得 到 图 10-18 显示 的 调度 方案 (为 简单 Be 

ENL, 我们 忽略 寄存 器 分 配 的 细节 ) 。 这 个 循环 执行 了 app 

13 个 时 钟 周期 ,或 者 说 每 个 迭代 执行 3. 25 个 周期 。 MI be | 








一 个 被 不 次 展开 的 循环 至 少 需要 2k +5 个 时 钟 周 
期 , 得 到 的 吞吐 量 是 每 2+5/% 个 时 钟 周期 一 个 送 代 。 ”图 10-18 例 10. 12 的 未 展开 的 代码 
因此 , 我 们 展开 的 迭代 越 多 , 循环 就 运行 得 越 快 。 当 k->% 时 , 一 个 完全 展开 的 循环 可 以 平均 每 
两 个 时 钟 周 期 执行 一 次 迭代 。 但 是 , 我 们 展开 的 迭代 越 多 , 得 到 的 代码 也 越 大 。 我 们 当然 承担 不 
起 把 一 个 循环 的 全 部 迭代 都 展开 的 代价 。 把 这 个 循环 展开 4 次 生成 了 有 13 条 指令 的 代码 , 执行 
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时 间 是 最 优 情况 的 163% ; 把 这 个 循环 展开 8 次 生成 了 带 有 21 条 指令 的 代码 , 执行 时 间 是 最 优 情 
况 的 131% 。 反 过 来 , 如 果 我 们 希望 执行 时 间 只 是 最 优 情况 的 110%, 我们 需要 把 这 个 循环 展开 
25 次 , 这 将 产生 带 有 55 条 指令 的 代码 。 四 
10.5.2 循环 的 软件 流水 线 化 

软件 流水 线 化 提供 了 一 个 方便 的 优化 方法 , 能 够 在 优化 资源 使 用 的 同时 保持 代码 的 简洁 。 
让 我 们 用 一 个 连续 的 例子 来 说 明 这 个 想法 。 
DEFY | (51 10-19 中 显示 的 是 把 例 10. 12 展开 5 次 之 后 得 到 的 代码 (我 们 再 次 忽略 了 对 寄存 器 
使 用 方面 的 考虑 )。 第 i 行 中 显示 的 是 在 第 i 个 时 钟 周 

















期 发 出 的 所 有 运算 指令 ; 第 / 列 中 显示 的 是 第 j KER | 人 

的 全 部 运算 。 请 注意 ， 相 对 于 各 个 选 代 的 开始 时 间 ， | 2 ID 

SERRA OER, 同时 要 注意 每 个 迭代 | 4 LD 

都 在 前 一 个 迭代 开始 两 个 时 钟 周期 之 后 开始 。 可 见 ，| ooy MUL bp 

这 个 调度 方案 满足 所 有 的 资源 和 数据 依赖 约束 。 7 MUL LD 

我 们 看 到 , 在 第 7 和 第 8 个 时 钟 周期 运行 的 运算 | g T 种 ha tip 

和 在 第 9 和 第 10 个 周期 运行 的 运算 是 一 样 的 。 第 7 | 10 st ADD LD 

和 第 8 个 时 钟 周 期 执行 的 运算 来 自 原 程序 中 的 前 四 | ia saa We RRR UE TB 

个 迭代 。 第 9 和 第 10 个 时 钟 周 期 执行 的 运算 也 是 来 “| 13 

自 四 个 迭代 , 不 过 这 次 是 来 自 第 2 到 第 5 个 迭代 。 实 | 15 R 

RE, 我 们 可 以 不 停 地 执行 同样 的 多 运算 指令 对 , 不 | 16 sT 

e Ee ee ery rem 
3 展开 后 得 到 的 代码 


如 果 假 设 这 个 循环 至 少 有 4 个 迭代 , 那么 这 样 的 
动态 行为 可 以 用 图 10-20 中 显示 的 代码 简洁 地 编码 。 
图 中 的 每 一 行 对 应 于 一 条 机 器 指令 。 第 7 行 和 第 8 
行 形 成 了 一 个 两 个 时 钟 周期 的 循环 。 这 个 循环 将 执 
行 -3 次 , 其 中 nn 是 原 循环 中 的 迭代 次 数 。 E 

上 面 描 述 的 技术 被 称 为 软件 流水 线 化 技术 , 因 
为 这 是 原本 用 于 硬件 流水 线 调 度 的 技术 在 软件 中 的 
对 应 。 我 们 可 以 把 这 个 例子 中 各 个 迁 代 执 行 的 调度 
方案 当 作 一 个 8 阶段 的 流水 线 。 每 两 个 时 钟 周期 就 
可 以 在 这 条 流水 线 上 启动 一 个 新 迭代 。 在 开始 的 时 
候 , 这 条 流水 线 中 只 有 一 个 迭代 在 运行 。 在 第 一 个 
迭代 进行 到 第 三 阶段 的 时 候 , 第 二 个 送 代 开 始 进入 AEEA EE 
它 的 第 一 个 执行 阶段 。 流水 线 化 的 代码 

到 第 7 个 时 钟 周期 时 , 流水 线 被 前 面 四 个 迭代 充 
满 。 在 稳定 状态 下 有 四 个 连续 的 迭代 同时 和 运行。 每 
当 流 水 线 中 最 老 的 迭代 退出 时 就 有 一 个 新 的 迭代 被 启动 。 当 我 们 运行 完 所 有 的 迭代 时 , 流水 线 
开始 排 空 , 其 中 的 所 有 迭代 运行 结束 。 用 来 填充 流水 线 的 指令 序列 (在 这 个 例子 中 是 第 1 到 第 6 
行 ) 被 称 为 序言 (prolog) ; 第 7 和 第 8 行 被 称 为 稳定 状态 (steady state); 用 来 排 空 流 水 线 的 指令 序 
列 ( 即 第 9 行 到 第 14 行 ) 被 称 为 尾声 (epilog) o 
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对 于 这 个 例子 , 我 们 知道 这 个 循环 不 可 能 运行 得 比 每 两 个 时 钟 周 期 一 个 迭代 更 快 。 原因 是 
目标 机 器 每 个 时 钟 周 期 只 能 发 出 一 个 读 指令 , 而 每 个 迭代 有 两 个 读 指令 。 上 面 的 经 软件 流水 线 
化 的 循环 在 2n +6 个 时 钟 周期 内 执行 完毕 , 其 中 是 原 循环 的 迭代 次 数 。 当 noo 时 ,这 个 循环 
MERESTE ARIE A, 和 循环 展开 技术 不 同 ， 软件 调度 可 以 用 “全 非常 简 

洁 的 代码 序列 给 出 最 优 调度 方案 的 编码 。 

请 注意 , 对 于 单个 迭代 而 言 , 这 个 调度 方案 的 运行 时 间 并 不 是 最 短 的 。 和 图 10-17 中 显示 的 
局 部 优化 的 调度 方案 相 比 , 这 个 方案 在 ADD 运算 之 前 引入 了 一 个 延 时 。 引 入 这 个 延 时 是 调度 策 
略 之 一 ， 其 目的 是 使 这 个 调度 方案 可 以 在 保证 没有 资源 冲突 的 情况 下 每 两 个 时 钟 周期 启动 一 
迭代 。 如 果 我 们 坚持 使 用 局 部 紧凑 的 调度 方案 ,为 了 避免 资源 冲突 , 各 次 启动 之 间 的 间隔 不 得 不 
延长 到 4 个 时 钟 周期 ， 而 吞吐 率 将 被 减 半 。 这 个 例子 说 明了 流水 线 调度 的 一 个 重要 原则 : 必须 小 
心 选择 调度 方案 以 便 优化 吞吐 量 。 虽 然 一 个 局 部 紧凑 的 调度 方案 可 以 使 完成 一 个 欠 代 的 时 间 降 
到 最 低 , 但 是 在 流水 线 化 之 后 得 到 的 吞吐 量 却 可 能 是 次 优 的 。 

10.5.3 寄存 器 分 配 和 代码 生成 

我 们 首先 讨论 例 10. 14 中 经 过 软件 流水 线 化 的 循环 的 寄存 器 分 配 。 

DEJ 在 例 10.14 中 ,第 一 个 迭代 中 的 乘法 运算 结果 在 第 3 个 时 钟 周期 生成 , 在 第 6 个 时 
钟 周期 使 用 。 在 这 两 个 时 钟 周期 之 间 , 第 二 次 迭代 中 的 这 个 乘法 运算 又 在 第 5 个 时 钟 周期 生成 一 
个 新 的 结果 ,这 个 值 在 第 8 个 时 钟 周期 使 用 。 这 两 次 迭代 的 结果 必须 保存 到 不 同 的 寄存 器 中 , 以 
防止 它们 之 间 互 相干 扰 。 因 为 干扰 只 会 在 两 个 相 邻 的 迭代 
之 间 发 生 , 使 用 两 个 寄存 器 就 可 以 避免 这 种 干扰 : 一 个 寄 
存 器 用 于 奇数 次 迭代 ,， 另 一 个 寄存 器 用 于 偶数 次 欠 代 。 因 
HAE BUGGER ARS AUER GAB R, 稳定 状态 
循环 的 代码 大 小 是 原来 的 两 倍 
何 具有 大 于 等 于 5 的 奇数 次 迭代 的 循环 。 

为 了 处 理 迭 代 次 数 小 于 5 的 循环 和 具有 偶数 次 迭代 的 
循环 , 我 们 生成 的 代码 在 源 语言 层次 上 和 图 10-21 中 的 代 ”图 10-21 例 10.12 中 循环 在 源 
码 等 价 。 第 一 个 循环 被 流水 线 化 了 , 它 的 机 器 语言 层次 的 语言 层次 上 的 展开 
等 价 表示 见 图 10-22。 图 10-21 的 第 三 个 循环 不 需要 优化 ， 因 为 它 最 多 迭代 4 次 。 O 


if (N >= 5) 

N2 = 3 + 2 * floor((N-3)/2); 
else 

N2 = 0; 


for = O;)4 < N2; rt) 

。 这 个 代码 可 以 用 于 执行 任 D[i] = Ari]* B[i +c; 

for (i = N2; i < N; i++) 
Di] = Ali]* B[i] + c; 








LD R5,0(R1++) 
LD R6,0(R2++) 








$0200 SEO eS NS 


LD R5,0(R1++) 
LD R6,0(R2++) 
LD R5,0(Ri++) 
LD R6,0(R2++) 
LD R5,0(R1++) 
LD R6,0(R2++) 
LD R5,0(R1i++) 
LD R6,0(R2++) 


MUL R7,R5,R6 


MUL R9,R5,R6 
ADD R8,R7,R4 
MUL R7,R5,R6 
ADD R8,R9,R4 
MUL R9,R5,R6 
ADD R8,R7,R4 
MUL R7,R5,R6 
ADD R8,R9,R4 


ADD R8,R7,R4 


ST 0(R3++) ,R8 
ST 0(R3++) ,R8 
ST 0(R3++) ,R8 
ST 0(R3++) ,R8 


ST 0(R3++) ,R8 


BL R10,L 





图 10-22 ”在 例 10. 15 中 经 过 软件 流水 线 化 和 寄存 器 分 配 之 后 得 到 的 代码 
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10.5.4 Do-Across 循环 


软件 流水 线 化 技术 也 可 以 用 于 各 个 迭代 之 间 存 在 数据 依赖 关系 的 循环 。 这 样 的 循环 被 称 为 
do-across 循环 。 


代码 


0 
sum = sum + A[i]; 
BLi] = Alil * b; 


的 两 个 连续 迭代 之 间 具 有 数据 依赖 关系 ,因为 前 一 次 的 sum (HA ALi | AINA ENT sum 值 。 如 
果 目 标 机 器 可 以 提供 足够 的 并 行 性 , 这 个 求 和 运算 可 以 在 0(logn) 时 间 内 完成 。 但 是 为 了 本 次 讨 
论 , 我 们 假设 必须 遵守 所 有 的 顺序 依赖 关系 , 上面 的 加 法 必须 以 原来 的 顺序 完成 。 因 为 我 们 假设 
的 机 器 模型 需要 两 个 时 钟 周期 才能 完成 一 个 ADD 运算 , 所 以 循环 的 运行 不 可 能 快 过 每 两 个 时 钟 
周期 一 个 欠 代 。 给 该 机 器 增加 更 多 的 加 法 器 和 乘法 器 都 不 会 使 循环 运行 得 更 快 。 像 这 样 的 do- 
across 循环 的 吞吐 量 受 迭代 之 间 的 依赖 链 的 限制 。 

图 10-23a 显示 了 每 个 和 迭代 的 最 好 的 局 部 紧凑 的 调度 方案 ,经 过 软件 流水 线 化 处 理 的 代码 在 
图 10-23b 中 显示 。 这 个 软件 流水 线 化 的 循环 每 两 个 时 钟 启 动 一 次 迭代 , 因此 运行 的 速度 是 最 优 








的 。 O 

// Ri = &A; R2 = &B 
// R3 = sum 

// R1 = &A: R2 = &B // R4 =b 

// R3 = sum // R10 = n-2 

// RA =b 

// R10 = n-1 LD R5, O(R1++) 
MUL R6, R5, R4 

: LD R5, OCRi++) El ADD Re R3 RA LD R5, O(R1i++) 

MUL R6, R5, R4 ST R6, O(R2++) MUL: R6, R5, R4 BL R10, L 

ADD R3, R3, R4 ADD R3, R3, R4 

ST R6, O(R2++) BL R105 L ST R6, O(R2++) 








a) 最 好 的 局 部 紧凑 的 调度 方案 b) 调度 方案 的 软件 流水 线 化 版 本 


10-23 ”一 个 do-across 循环 的 软件 流水 线 化 


10. 5.5 软件 流水 线 化 的 目标 和 约束 

软件 流水 线 化 的 主要 目标 是 使 一 个 长 时 间 运 行 的 循环 的 吞吐 量 最 大 , 次 要 目标 之 一 是 使 生 
成 代码 保持 合理 的 大 小 。 换 名 话说 ,经 过 软件 流水 线 化 的 循环 应 该 有 一 个 较 小 的 流水 线 稳定 状 
态 。 我 们 可 以 要 求 每 个 迭代 的 相对 调度 方案 相同 , 并 要 求 各 个 迭代 启动 的 时 间 间 隔 相 同 , 从 而 得 
到 一 个 较 小 的 稳定 状态 。 因 为 循环 的 吞吐 量 是 启动 间隔 的 倒数 , 所 以 软件 流水 线 化 的 目标 是 使 
这 个 间隔 最 小 化 。 

一 个 数据 依赖 图 6 = (N,E) 的 软件 流水 线 调 度 方案 可 以 描述 为 

1) 一 个 启动 间隔 7。 

2) 一 个 相对 调度 方案 5S。 对 每 个 运算 , 它 给 定 了 该 运算 相对 于 它 所 处 迭代 的 开始 时 刻 的 执 
行 时 间 。 

因此 , 如 果 从 0 开始 计算 时 钟 周期 的 话 , 第 i 个 迭代 的 一 个 运算 n 将 会 在 第 ixT+5S(n) 个 时 
钟 周期 上 运行 。 和 所 有 其 他 的 调度 问题 一 样 , 软件 流水 线 化 有 两 种 约束 : 资源 和 数据 依赖 关系 。 


指令 级 并 行 性 a 





下 面 我 们 详细 讨论 每 一 种 约束 。 

模 数 资源 预约 

今 一 个 机 器 的 资源 表示 为 R= [nor l; 其 中 7 表示 第 i 种 资源 的 可 用 数目 。 如 果 一 个 特 
环 的 单 次 迭代 需要 n 个 单元 的 第 i 种 资源 , 那么 一 条 流水 线 化 的 循环 的 平均 启动 间隔 至 少 是 
max, (n;/r;) 个 时 钟 周期 。 软 件 流水 线 化 要 求 在 任何 一 对 相 邻 迭代 之 间 的 启动 间隔 是 一 个 常量 值 。 
因此 , 它 的 启动 间隔 至 少 是 maxi[ ni/r;1 个 时 钟 周期 。 如 果 maxi(ni/r;) 小 于 1, 那么 把 源 代码 少量 
展开 几 次 就 有 助 于 提高 代码 效率 。 
HERA 让 我 们 可 到 图 10-20 所 示 的 经 过 软件 流水 线 化 处 理 的 循环 。 回 顾 一 下 ,目标 机 器 可 
以 在 每 个 时 钟 周期 内 发 出 一 个 加 载 指令 、 一 个 算术 运算 指令 、 一 个 保存 指令 和 一 个 循环 回归 分 支 
指令 。 因 为 这 个 循环 有 两 个 加 载运 算 、 两 个 算术 运算 和 一 个 保存 运算 , 所 以 根据 资源 约束 ,这 个 
循环 的 最 小 启动 间隔 是 2 个 时 钟 周期 。 

图 10.24 显示 了 四 个 连续 闪 代 在 不 同时 刻 的 资源 需求 。 随 着 被 启动 迭代 数量 的 增加 ,所 需 的 
资源 也 越 来 越 多 ; 最 终 达 到 稳定 状 he 
态 下 的 最 大 资源 需求 。 令 RT 为 表 Ld AluSt 
示 单 个 迭代 所 需 资源 的 资源 预约 uwa 
K, 并 令 RTs 表示 循环 的 稳定 状态 
所 需要 的 资源 。RTs 把 每 隔 了 个 
时 钟 周期 启动 的 四 个 相 邻 迭代 所 
需 的 资源 组 合 起 来 。R7s 表 的 第 0 mi 
行 所 需 的 资源 是 RTL0]、RT[2]、 
RT[4] 和 RT[6] 所 需 资 源 的 总 和 。 
类 似 地 , 表 中 第 1 行 所 需 资源 对 应 
于 RT[1] RT[3] \RT[5] 和 RT[7] 
所 需 资源 的 总 和 。 也 就 是 说 , 稳定 
状态 下 第 ; 行 所 需 资源 可 以 由 下 面  ' 
人 图 10.24 10. 13 中 的 代码 的 四 个 连续 迁 代 的 资源 需求 

RET a) OY TRE] 


[el (r mod 2) = 让 
我 们 把 表示 稳定 状态 的 资源 预约 表 称 为 这 条 流水 线 化 的 循环 的 模 数 资源 预约 表 ( modular resource- 
reservation ) 。 

为 了 检查 软件 流水 线 调度 方案 是 否 存在 冲突 , 我 们 只 需要 检查 模 数 资源 预约 表 中 指出 的 资 
源 需 求 。 如 果 在 稳定 状态 下 的 资源 需求 可 以 被 满足 , 那么 在 序言 和 尾声 中 , 即 在 稳定 状态 循环 之 
前 和 之 后 的 代码 部 分 中 , 资源 需求 也 一 定 可 以 被 满足 。 O 

总 的 来 说 , 给 定 一 个 启动 间隔 下 和 单个 迭代 的 一 个 资源 预约 表 RT, 流水 线 化 的 调度 方案 在 
二 个 资源 向 量 为 届 的 机 器 上 没有 资源 冲突 , 当 且 仅 当 RT li] SR Mi =0,1,---, 7-1 都 成 立 。 

数据 依赖 约束 

在 软件 流水 线 化 中 的 数据 依赖 关系 和 我 们 至 今 为 止 遇 到 的 依赖 关系 不 同 , 因为 它们 可 能 会 
形成 环 。 一 个 运算 可 能 会 依赖 于 前 一 个 迭代 中 同一 个 运算 的 结果 。 现 在 仅仅 在 依赖 边 上 加 上 一 
个 表示 延 时 的 标号 已 经 不 够 了 , 我 们 还 需要 区 分 同一 个 运算 在 不 同 迭 代 中 的 实例 。 如 果 在 第 i 次 
迭代 中 的 运算 必须 在 第 i -6 次 迭代 中 的 运算 ni 执行 至 少 a 个 时 钟 之 后 才 可 以 执行 , 那么 我 们 
给 依赖 边 ni 一 ns 加 上 标号 <6,d > 。 令 S 是 软件 流水 线 化 的 调度 方案 ; 它 是 一 个 从 数据 依赖 图 中 


迭代 2 
Ld AluSt 





Steady state 
Ld AluSt 
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的 结 点 到 整数 的 函数 ,并 令 7 为 启动 时 间 间 隔 的 目标 , 那么 
(xT) +S(n.) -S(n,) Sd 

其 中 的 迭代 距离 8 必须 是 非 负 的 。 而 且 , 给 定 一 个 由 数据 依赖 图 的 边 组 成 的 环 ,至 少 一 个 边 具有 

正 的 迭代 距离 。 

i) 10. 18 考虑 下 面 的 循环 , 并 假设 我 们 不 知道 p 和 9 的 值 ; 


for (i = 0; i < n; i++) 
*(p++) = *(qt+) + c; 


我 们 必须 假设 任何 一 对 *(p ++ ) 和 *(G++ ) 都 可 能 访问 同一 个 内 存 位 置 。 因 此 , 所 有 的 读 
和 与 运算 都 必须 按照 原来 的 串 行 顺 序 进 行 。 假 设 本 例 中 目标 机 器 ks Ra IS a 
和 例 10. 12 中 描述 的 机 器 有 同样 的 特性 , 这 有 段 代码 的 数据 依赖 边 VR 


如 图 10-25 所 示 。 但 是 , 请 注意 我 们 忽略 了 循环 控制 指令 。 本 来 rt 
应 该 有 这 条 指令 的 , 它 要 么 计算 并 测试 i 的 值 , 要 么 根据 Ri 或 pp 
ADD R5,R4,R3 j 





R2 的 值 来 完成 这 个 测试 。 
如 下 例 所 示 , 两 个 相关 运算 之 间 的 迭代 距离 可 以 大 于 1: 





<072>; 
for G = 2; i< n; i++) 3 
Ali] = B[i] + Ali-2]; ST O(R2++),R5 





在 第 i 个 迭代 中 写 入 的 值 在 两 个 迭代 之 后 才 会 被 用 到 。 因 此 图 1025 fa} 10.18 的 
在 保存 4[ 训 的 运算 和 加 载 4[;i- 2] 的 依赖 边 之 间 的 迭代 距离 数据 依赖 图 
是 2。 

一 个 循环 中 出 现 的 数据 依赖 环 还 对 循环 的 执行 吞吐 量 增 加 了 另 一 个 限制 。 比 如 , 图 10.25 中 
的 数据 依赖 环 限定 了 两 个 连续 迭代 中 的 加 载运 算 之 间 必须 有 至 少 4 个 时 钟 周期 的 延 时 ， 也 就 是 
说 , 循环 的 执行 不 可 能 快 过 每 4 个 时 钟 周期 一 次 迭代 。 

一 个 被 流水 线 化 的 循环 的 启动 间隔 不 小 于 


a È epte 
< 是 一 个 6 中 的 圈 学 6 
e 在 c 中 e 


个 时 钟 周期 。 

总 结 一 下 ， 每 个 被 软件 流水 线 化 的 循环 的 启动 间隔 受到 每 个 迭代 的 资源 使 用 情况 限制 。 也 
就 是 说 , 对 于 每 一 类 资源 ,启动 间隔 必须 不 小 于 一 次 迭代 所 需 该 类 资源 的 数目 除 以 机 器 上 该 类 次 
源 的 可 用 数量 所 得 的 商 。 另 外 ， 如 果 循 环 中 存在 数据 依赖 环 ， 那么 它 的 启动 间隔 还 必须 不 小 于 这 
个 环 中 的 延 时 总 数 除 以 环 中 迭代 距离 之 和 得 到 的 商 。 这 些 量 的 最 大 值 定义 了 启动 间隔 的 下 界 。 
10.5.6 一 个 软件 流水 线 化 算法 

软件 流水 线 化 的 目标 是 找到 一 个 具有 最 小 启动 间隔 的 调度 方案 。 这 个 问题 是 NP 完全 的 ,并 
且 可 以 被 写成 一 个 整数 线性 规划 问题 。 我 们 已 经 说 明 ,如果 知道 最 小 的 启动 间隔 , 那么 调度 算法 
可 以 在 放置 各 个 运算 时 使 用 模 数 资源 预约 表 来 避免 资源 冲突 。 但 是 只 有 当 我 们 找到 一 个 调度 方 
案 之 后 才能 知道 最 小 启动 间隔 是 什么 。 我 们 怎样 才能 解 开 这 样 的 循环 套 ? 

我 们 可 以 按照 上 面 讨论 的 方法 根据 循环 的 资源 需求 和 依赖 环 计算 得 到 启动 间隔 的 下 界 我 
们 已 知 启动 间隔 必须 大 于 这 个 下 界 。 如 果 我 们 可 以 找到 一 个 调度 方案 使 得 启动 间隔 就 是 这 个 下 
界 , 那么 就 找到 了 最 优 的 调度 方案 。 如 果 我 们 找 不 到 这 样 的 调度 方案 ， 可 以 再 使 用 大 一 点 的 启动 
间隔 进行 尝试 , 直到 找到 一 个 符合 要 求 的 调度 方案 为 止 。 请 注意 , 如 果 使 用 启发 式 搜索 而 不 是 穷 
REZ, 那么 这 个 过 程 找到 的 可 能 不 是 最 优 的 调度 方案 。 


BABE > 





我 们 能 否 找到 接近 下 界 的 调度 方案 依赖 于 相应 数据 依赖 图 的 性 质 以 及 目标 机 的 体系 结构 。 
如 果 依赖 图 是 无 环 的 , 并 且 每 条 机 器 指令 只 需要 一 个 单元 的 某 种 资源 , 那么 我 们 可 以 很 容易 地 找 
到 最 优 的 调度 方案 。 如 果 可 用 的 硬件 资源 超过 了 有 环 的 依赖 图 所 需要 的 资源 , 那么 也 很 容易 找 
到 启动 间隔 接近 于 下 界 的 调度 方案 。 对 于 这 些 情况 , 建议 一 开始 就 把 下 界 作为 初始 的 启动 间隔 
目标 , 然后 逐渐 把 目标 增加 一 个 时 钟 周期 , 并 且 每 增加 一 次 进行 一 次 调度 尝试 。 另 一 种 可 能 性 是 
使 用 二 分 搜索 法 来 寻找 启动 间隔 。 我 们 可 以 把 列表 调度 法 为 单 次 迭代 生成 的 调度 方案 的 长 度 作 
为 启动 间隔 的 上 界 。 

10.5.7 ”对 无 环 数据 依赖 图 进行 调度 

为 简 音 起见, 我们 现在 假设 即将 进行 软件 流水 线 化 处 理 的 循环 只 包含 二 个 基本 块 。 在 
10. 5. 11 节 中 将 放宽 这 个 假设 条 件 。 

对 一 个 无 环 依赖 图 进行 软件 流水 线 化 处 理 。 

WA: 一 个 机 器 资源 向 量 R = [ ,r,,…] ,其 中 7 表示 第 i 种 资源 的 可 用 单元 数量 ; 一 个 数据 
依赖 图 = (NV,E) 。N 中 的 每 个 运算 ”用 它 的 资源 预约 表 RT, 作为 标号 ; E 中 的 每 条 边 。= hn， 
上 有 标号 <6。,d。 > 。 这 个 标号 表示 m 只 能 在 往 前 第 6, 个 迭代 中 的 结 点 站 执行 d, 个 时 钟 周期 之 
后 才 可 以 执行 。 

输出 : 一 个 经 过 软件 流水 线 化 的 调度 方案 S 和 一 个 启动 间隔 7。 

方法 : 执行 图 10-26 中 的 程序 。 口 

算法 10. 19 将 无 环 的 数据 依赖 图 进行 软件 流水 线 化 处 理 。 这 个 算法 首先 基于 图 中 运算 的 资源 
需求 找到 启动 间隔 的 界限 Ty 








然后 它 尝 试 以 Ty 为 启动 间隔 的 
目标 , 寻找 一 个 软件 流水 线 化 
的 调度 方案 。 如 果 算 法 不 能 为 
当前 目标 找到 一 个 调度 方案 ， 
它 就 不 断 增加 启动 间隔 并 重复 
尝试 。 

这 个 算法 在 每 次 尝试 中 使 
用 了 一 个 列表 调度 方法 。 它 使 
用 一 个 模 数 资源 预约 表 RT 来 跟 
踪 流 水 线 的 稳定 状态 所 要 求 的 
资源 。 运 算 按照 拓扑 顺序 进行 
调度 , 以 便 总 是 能 够 通过 推迟 
运算 来 满足 数据 依赖 关系 。 为 
了 调度 一 个 运算 , 它 首先 根据 
数据 依赖 约束 找到 一 个 下 界 so。 
然后 , 它 调 用 NodeScheduled 来 
检测 在 稳定 状态 上 可 能 发 生 的 
资源 冲突 。 如 果 发 现 了 资源 冲 






main() { 





Pai Er 








To = max 


了 Tj 
for (T = To, To 十 1,,.. ,直到 NN 中 的 所 有 结 点 都 已 经 被 调度 完毕 ) { 
RT = 一 个 具有 了 行 的 空 的 资源 预约 表 ; 
for ( 核 照 带 优先 级 的 拓扑 顺序 访问 N 中 的 每 个 结 点 ) { 
50 = maxp 中 的 边 e=p_sn(S(p) + de); 
for (s = 80,80 + 1,... ,39 +T — 1) 
if (NodeScheduled(RT,T,n,s) break; 
if ( n 无 法 在 RT 中 调度 ) break; 


, 










} 






} 
} 


NodeScheduled(RT,T,n, s) { 
1 










for (在 RT, 中 的 每 一 行 1 ) 

RT'[(s +i) mod T] = RT'[(s + i) mod T] + RT, {i}; 
if (对 于 所 有 i, RT'(i) < R) { 

RIE RE 






Sn) =s; 
return true; 







else return false; 


E 10-26 无 环 依赖 图 的 软件 流水 线 化 算法 


R, 该 算法 试图 把 这 个 运算 安排 在 下 一 个 时 钟 周期 。 因 为 资源 冲突 检测 的 取 模特 性 ,如 果 发 现 该 
运算 在 连续 7 了 个 时 钟 周 期 上 都 有 冲突 ， 那么 继续 尝试 也 不 会 有 用 。 此 时 ,这 个 算法 认为 对 当前 启 
动 间隔 目标 的 尝试 已 经 失败 , 继续 尝试 男 一 个 启动 间隔 。 
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把 各 个 运算 尽早 安排 的 启发 式 规则 往往 会 使 单个 迭代 的 调度 方案 的 长 度 最 小 化 。 但 是 , 尽 
早 安排 二 条 指令 可 能 会 加 长 某 些 变量 的 生命 期 。 比如 , 加 载 数据 的 运算 往往 会 被 较 早 安排 ， 有 时 
候 会 在 数据 被 使 用 前 很 早 就 执行 。 处 理 这 个 问题 的 一 个 简单 的 启发 规则 是 逆向 地 调度 一 个 依赖 
图 , 理由 是 加 载运 算 通常 要 多 于 保存 运算 。 

10.5.8 对 有 环 数据 依赖 图 进行 调度 

依赖 环 明显 地 增加 了 软件 流水 线 化 的 复杂 性 。 当 按照 拓扑 顺序 对 一 个 无 环 图 中 的 运算 进行 
调度 时 ， 被 调度 的 运算 之 间 的 数据 依赖 关系 只 能 给 出 每 个 运算 位 置 的 下 界 。 结果 , 算法 总 是 能 够 
通过 推迟 运算 来 满足 数据 依赖 关系 。 有 环 的 图 没有 “拓扑 排序 ”的 概念 。 实 际 上 , 给 定 一 个 环 中 
的 一 对 运算 , 放置 一 个 运算 会 限定 第 二 个 运算 的 位 置 的 下 界 和 上 和 界 。 

A n, Ail ny 是 一 个 依赖 环 中 的 两 个 运算 , S 是 一 个 软件 流水 线 调度 方案 , 而 了 是 这 个 调度 方 
案 的 启动 间隔 。 一 个 带 有 标号 <61,d1 > 的 依赖 边 ning 对 S(nj ) All S(mz) 加 上 了 如 下 约束 : 

(6, xT) +S(nz) -S(n,) 2d, 
类 似 地 ， 一 个 带 有 标号 <6, ,ds > 的 依赖 边 ny, 增加 了 如 下 约束 : 
(8 xT) +S(n,) Sm) Sd, 
因此 
S(n,) +d, - (8; x T) <S(nz) <S(n,) -d + (6) xT) 

一 个 图 的 强 连通 分 量 ( Strongly Connected Component, SCC) 是 满足 如 下 条 件 的 一 个 结 点 集合 ， 
其 中 的 每 个 结 点 都 可 以 从 集合 中 的 所 有 其 他 结 点 到 达 。 对 SCC 中 的 一 个 结 点 进行 调度 将 会 从 上 
下 两 个 方向 限制 其 他 各 个 结 点 的 可 行 时 间 。 如 果 存 在 一 个 从 nl 到 ny 的 路 径 p, 那么 有 

Sim) - S(m) > J U. H (8. x 1)) (10. 1) 

请 注意 下 面 的 情况 : 

1) 沿 着 任何 一 个 环 , 各 个 边 上 的 5 值 的 总 和 必须 为 正 。 如 果 和 是 0 或 者 负数 , 就 表明 环 中 的 
一 个 运算 要 么 必须 在 它 自己 之 前 执行 , 要 公所 有 和 迭代 中 的 该 运算 都 在 同一 时 钟 周期 执行 。 

2) 一 个 迭代 中 的 各 运算 的 调度 方案 和 所 有 迭代 中 的 调度 方案 相同 ， 这 个 要 求实 质 上 就 是 
“软件 流水 线 ” 的 含义 。 结 果 ， 一 个 环 上 的 延 时 ( 即 数 据 依赖 图 中 边 的 标号 的 第 二 个 元 素 ) 的 总 和 
除 以 环 上 的 迭代 距离 的 总 和 所 得 的 商 就 是 启动 间隔 了 的 一 个 下界 。 

当 我 们 把 这 两 点 联系 起 来 , 就 可 以 看 到 , WE p 是 一 个 环 , 那么 对 于 任何 可 行 的 启动 间隔 T, 
ROO. 1) 的 右边 部 分 的 值 必然 是 负数 或 零 。 由 此 可 见 , 对 于 结 点 位 置 的 最 强 约 束 来 自 于 简单 路 
径 一 一 那些 不 包含 环 的 路 径 。 

因此 , 对 于 每 个 可 行 的 启动 间隔 7, 计算 每 对 结 点 之 间 的 数据 依赖 关系 的 传递 效果 就 等 同 于 

寻找 从 第 一 个 结 点 到 达 第 二 个 结 点 的 最 长 的 简单 路 径 。 不 仅 如 此 ,因为 环 不 会 增加 一 条 路 径 的 
长 度 , 所 以 可 以 用 一 个 简单 的 动态 规划 算法 在 没有 “简单 路 Sub 
径 ” 需 求 的 情况 下 来 寻找 最 长 路 径 。 这 样 得 到 的 长 度 也 一 定 
是 最 长 简单 路 径 的 长 度 ( 见 练习 10. 5.7) 。 
图 10-27 PR TAWA A abcd 的 数据 依 
赖 图 。 每 个 结 点 上 附加 了 该 结 点 的 资源 预约 表 , 每 条 边 上 
附加 了 它 的 迭代 距离 和 延 时 。 假 设 这 个 例子 中 的 目标 机 顺 
的 每 一 种 资源 都 有 一 个 单元 。 因 为 对 第 一 种 资源 有 三 处 使 
用 , 而 第 二 种 资源 有 两 处 使 用 , 所 以 启动 间隔 必须 不 小 于 3 eee de, 
个 时 钟 。 在 这 个 图 中 有 两 个 连通 分 量 : 第 一 个 是 只 包含 了 依赖 图 和 资源 需求 
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结 点 a 的 分 量 , BOTS ST a bic Ald, MEN bcd b 的 总 延 时 是 3 个 时 钟 周 期 。 这 
个 环 把 相隔 一 个 迭代 的 结 点 连接 起 来 。 因 此 , 根据 数据 依赖 环 约束 得 到 的 启动 间隔 的 下 界 也 
是 3 个 时 钟 周期 。 

对 5b\c 或 d 中 的 任何 一 个 进行 调度 都 会 对 分 量 中 的 其 他 结 点 产生 约束 。 令 7 为 启动 间隔 。 图 
10-28 显示 了 传递 依赖 关系 。 图 10-28a 显示 
















































































了 每 条 边 的 延 时 和 迭代 距离 5。 其 中 的 延 时 ， 广 POE 
是 直接 表示 的 , 而 5 则 是 通过 在 延 时 上 “加 ” ， | 
上 -57 来 表示 的 。 c : ete 
如 果 两 个 结 点 之 间 存 在 简单 路 径 , 那么 “ eset! 
图 10-28b 中 就 显示 了 这 两 个 结 点 之 间 的 最 长 b) 最 长 简单 路 径 
简单 路 径 的 长 度 。 表 中 的 项 是 图 10-28a 中 给 a — a 
出 的 路 径 上 各 条 边 的 表达 式 的 和 。 然 后 , E [二 一 站- a 
图 10-28¢ 和 图 10-284 H, 我 们 看 到 的 表达 式 e la -EH 
是 将 图 10-28b HFA HAY TR l dela d 3] 2 
关 值 ( 即 3 和 4) 之 后 得 到 的 表达 式 。 根 据 不 c) 最 长 简单 路 径 (7=3) d) 最 长 简单 路 径 (7=4) 
同 的 了 值 , 两 个 结 点 nl Al ny 的 调度 时 间 位 10-28 fi) 10. 20 中 的 传递 约束 


置 之 差 Sm ) -5S(ni) 必 须 不 小 于 在 图 10-28e 
或 图 10-28d 中 的 项 (mi ,zz ) 的 值 。 

比如 , 考虑 图 10-28 中 给 出 的 表示 从 e 到 刀 的 最 长 (简单 ) 路 径 的 项 2 -T, Me 到 5b 的 最 长 简 
单 路 径 是 c 一 qd 一 5。 这 条 路 径 上 的 总 延 时 是 2, 而 5 的 和 是 1, 它 表明 迭代 编号 必须 加 1。 因 为 了 
表示 每 个 欠 代 和 前 一 个 迁 代 的 时 间 差 异 , 为 5 安排 的 时 钟 周 期 必须 至 少 是 安排 给 c 的 时 钟 周期 之 
后 的 第 2 -7 个 时 钟 周期 。 因 为 7 至 少 是 3, 我 们 实际 上 是 说 5 必须 被 安排 在 c 之 前 的 7-2 个 时 
钟 周期 或 再 晚 一 些 , 但 是 不 能 更 早 了 。 

请 注意 , FEMA cA b 的 非 简单 路 径 并 不 会 产生 更 强 的 约束 。 我 们 可 以 在 路 径 c->d-b 上 加 
上 由 4d Alb AMM AERA UIE WRT LE kh SRM, 因为 路 径 的 总 延 时 为 3, 而 
环 上 的 6 的 总 和 是 1, 我 们 得 到 的 路 径 长 度 为 2-7T+k(3 一 7T)。 因为 7=3, 所 以 这 个 长 度 绝 不 会 
超过 2 -7, 即 6 的 时 钟 和 < 的 时 钟 的 差 的 下 界 是 2 -7, 也 就 是 我 们 考虑 最 长 简单 路 径 时 得 到 的 
界限 。 

比如 , 从 项 (58,c) 和 (c,d) 我 们 可 以 知道 

So) — Sb) =1 
S = Sc) ]2-T. 
Sohl = Sele, SOB) 1 E 

mÆ T =3, 

S(6).+1 < S(e).< S(b) +1 
等 价 地 说 ，e 必须 被 安排 在 5 后 一 个 时 钟 周 期 上 。 但 是 , 如 果 7=4, 则 

S(b) +1 < S(c) < S(b) +2 
也 就 是 说 , c 可 以 被 安排 在 2 后 的 一 个 或 两 个 时 钟 周期 上 。 

给 定 所 有 点 对 之 间 的 最 长 路 径 的 信息 , 我 们 可 以 很 容易 地 计算 出 由 于 数据 依赖 的 原因 ， 一 个 
结 点 可 以 放置 在 什么 位 置 。 我 们 看 到 , 当 7=3 BCR A b 的 位 置 是 没有 松弛 度 的 , 而 当 7 增 
加 的 时 候 这 个 松弛 度 会 增加 。 回 
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软件 流水 线 化 。 

输入 : 一 个 机 器 资源 向 量 R= [mi ,r，,…], 其 中 7; 表示 第 i 种 资源 的 可 用 单元 的 数量 ; 一 个 数 
据 依赖 图 C= (N,E)。N 中 的 每 个 运算 nn 的 标号 为 它 的 资源 预约 表 RT, ; E PREAH e = n,n, 
上 有 标号 < 8。,d。 >， 这 个 标号 表示 n 的 执行 时 刻 不 能 早 于 向 前 第 6。 个 迭代 中 的 结 点 nj 之 后 的 
d, 个 时 钟 周期 。 

输出 : 一 个 软件 流水 线 化 的 调度 方案 S 和 一 个 启动 间隔 To 

方法 : 执行 图 10-29 中 的 程序 。 Oo 


























main() { 
E' = {ele in E, ôe = 0}; 
Pee RT, (i, j) Dee in c de = 
ee (ax | Tj | e seyelein i in amily 
for (T = To, To + 1,... 或 者 直到 G 中 的 所 有 SCC 都 已 经 被 调度 完毕 ){ 
RT = 一 个 工行 的 空 资源 预约 表 ; 
E* = AllPairsLongestPath(G,7T); 
for ( 以 带 优先 级 的 拓扑 顺序 遍历 G 中 的 每 个 SCC C) { 
for (对 CC 中 的 各 个 又) 
so(n) = MaXe=p—n in E+ ,p scheduled (S(p) + de); 
js 三 某 个 使 得 so(m) 取 最 小 值 的 m; 
so = So(first); 
for (s = so; s < so + T3s=8+41) 
if (SccScheduled (RT,T, C, first, s)) break; 
if (CABLE RT 中 调度 ) break; 





} 


SccScheduled( RT, T, c, first, s) { 

W UR 

if (not NodeScheduled (RT',T, first, s)) return false; 

for (按照 Bl 中 各 条 边 的 带 优先 级 的 拓扑 排序 

访问 c 中 余下 的 每 个 ) { 
51 = MAXe=n'—n in E*,n’ in cmtischeduled(S(n') + de — (de x SE 
Su = mine=n yn’ in E*,n! in c,n’ scheduled (5 (72) S (de x TIY 
for (s = s1;s< min(su, 5; + T — 1); s=s+1) 
if (NodeScheduled(RT',T,n,s)) break; 

if ( nn 不 能 够 在 RT' 中 调度 ) return false; 


} 
RT SRE: 
return true; 











图 10-29 一 个 针对 有 环 依赖 图 的 软件 流水 线 化 算法 


算法 10. 21 在 高 层 结构 上 和 只 能 处 理 无 环 图 的 算法 10. 19 类 似 。 在 本 算法 处 理 的 情况 中 , 最 
小 的 启动 间隔 不 仅 受 到 资源 需求 的 限制 , 也 受到 图 中 数据 依赖 环 的 限制 。 整 个 图 是 按照 每 次 处 
理 一 个 强 连通 分 量 的 方式 进行 调度 的 。 通 过 把 每 个 强 连 通 分 量 当 作 一 个 单元 , 在 强 连通 分 量 之 
间 的 边 必 然 形 成 一 个 无 环 图 。 算 法 10. 19 的 顶层 循环 按照 拓扑 顺序 来 调度 图 中 的 结 点 , 而 算法 
10. 21 的 顶层 循环 按照 拓扑 顺序 调度 各 个 强 连 通 分 量 。 和 前 面 一 样 , 如 果 算 法 不 能 调度 所 有 的 分 
E, 那么 它 就 会 尝试 较 大 的 启动 间隔 。 请 注意 , 如 果 给 定 一 个 无 环 的 数据 依赖 图 , 算法 10.21 和 
算法 10. 19 的 做 法 是 完全 一 样 的 。 

算法 10. 21 要 计算 得 到 额外 两 个 边 集 : 8' 是 所 有 的 迭代 距离 为 0 的 边 , 而 E* 是 所 有 点 对 之 


指令 级 并 行 性 








间 的 最 长 路 径 边 集 。 也 就 是 说 , 对 每 个 结 点 对 (p,n)，, 只 要 有 一 条 从 bp 到 nn 的 路 径 , 在 五 中 就 有 
一 条 边 e, 该 边 所 关联 的 长 度 ds EA p 到 的 最 长 简单 路 径 的 长 度 。 对 于 启动 间隔 目标 7 的 每 一 
个 取 值 都 需要 计算 相应 的 E* 。 也 可 以 像 我 们 在 练习 10. 20 中 所 做 的 那样 ， 先 使 用 了 的 符号 化 值 
一 次 性 完成 这 个 计算 过 程 , 然后 在 每 一 次 迭代 的 时 候 把 7 了 蔡 换 为 实际 的 启动 间隔 的 值 。 

算法 10.21 使 用 了 回 湖 。 如 果 它 不 能 完成 一 个 SCC 的 调度 , 它 就 会 延 后 一 个 时 钟 周期 再 次 
对 整个 SCC 进行 调度 。 这 些 调度 尝试 会 持续 7 个 时 钟 周 期 。 回 漳 是 很 重要 的 , 因为 如 例 10. 20 
所 示 , 对 于 一 个 SCC 中 的 第 一 个 结 点 的 调度 安排 可 能 会 完全 地 决定 所 有 其 他 结 点 的 调度 安排 。 
如 果 这 个 调度 方案 不 能 和 至 今 已 经 产生 的 调度 方案 配合 , 那么 这 次 尝试 就 失败 了 。 

在 对 一 个 SCC 进行 调度 时 , 对 该 分 量 中 的 每 个 结 点 , 此 算法 确定 了 满足 B* 中 的 传递 数据 依 
赖 关 系 的 最 早 可 调度 的 时 间 。 然 后 ,算法 选择 具有 最 早 开始 时 间 的 结 点 作为 第 一 个 被 调度 的 结 
点 。 然 后 ， 此 算法 调用 SccScheduled, 试图 根据 这 个 最 早 开 始 时 间 实 际 调度 这 个 分 量 。 如 果 尝 试 
失败 ,此 算法 将 逐次 增 大 开始 时 间 , 不 断 尝试 。 该 算法 最 多 做 7 次 尝试 。 如 果 了 次 尝试 失败 了 ， 
该 算法 就 会 尝试 男 一 个 启动 间隔 。 

算法 SccScheduled 和 算法 10. 19 类 似 , 但 是 有 三 大 不 同 之 处 : 

1) SccScheduled 的 目标 是 对 输入 的 强 连通 分 量 在 给 定时 间 位 置 上 进行 调度 。 如 果 该 强 连 通 
分 量 的 第 一 个 结 点 不 能 被 安排 在 s 上 ，SccScheduled 就 返回 false。 在 需要 时 , 主 函 数 main 可 以 使 
用 一 个 较 晚 的 时 间 位 置 再 次 调用 SceScheduled。 

2) 在 强 连 通 分 量 中 的 结 点 按照 &” 中 的 边 集 所 确定 的 拓扑 顺序 进行 调度 。 因 为 Eb’ 中 的 所 有 
边 的 迭代 距离 都 是 0, 这 些 边 不 会 穿越 任何 迭代 边界 , 也 就 不 会 形成 环 ( 穿越 迭代 边界 的 边 被 称 
为 穿越 循环 的 )。 只 有 穿越 循环 的 依赖 会 设置 指令 可 调度 位 置 的 上 界 。 因 此 , 这 个 调度 顺序 以 及 
尽早 调度 安排 各 条 指令 的 策略 把 后 继 结 点 的 可 调度 范围 最 大 化 了 。 









































3) 对 于 强 连通 分 量 , 依赖 关 [「 et 
系 既 给 出 了 一 个 结 点 的 可 调度 范 尝试 启动 间隔 “| 结 点 | 区间 调度 安排 
围 的 下 界 ， 又 给 出 了 其 上 界 。| ， BER ‘co 
SccScheduled 计算 了 这 些 范围 , 并 c (3, 3) on 
使 用 它们 进一步 限制 调度 尝试 。 : a : 
5) 10. 22) 让 我 们 把 算法 oa | asia asta ae 
应 用 到 例 10. 20 中 的 有 环 的 数据 CR ele 
依赖 图 上 。 算法 首先 计算 出 这 个 -| 3 | Taa | 2 LOO) & 
例子 的 启动 间隔 的 下 界 是 3 个 时 | a | 6e | =- 
钟 周 期 。 注意 , 这 个 下 界 不 可 能 $l alg 
达到 a 当 启 动 间隔 7 了 是 3 时 , 图 ! | 和 
1008 He IMR Mae RIE T E : a = 
S(d) - S(b) =2, HAR b Md Z I a Be A te ee 3 
排 在 间隔 两 个 时 钟 的 位 置 会 在 长 证人 对 和 
度 为 3 的 模 数 资源 预约 表 中 产生 Fal Wa hy 
aS " F b ae) 7 

图 10-30 说 明了 算法 10. 21 是 HE er 3 


如 何 处 理 这 个 例子 的 。 它 首先 试 
图 找到 一 个 启动 间隔 为 3 个 时 钟 

















图 10-30 算法 10.21 在 处 理 例 10.20 时 的 行为 
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周期 的 调度 方案 。 这 次 尝试 开始 时 ， 算法 尽 可 能 早 地 调度 结 皮 = 和 25 但 是 , 一旦 结 点 b REH 
在 第 二 个 时 钟 周期 ， 结 点 就 只 能 安排 在 第 3 个 时 钟 周期 。 这 和 结 点 “的 资源 使 用 相 冲突 。 也 对 
是 说 , a 和 < 在 能 够 被 3 整除 的 时 钟 周期 上 都 需要 第 一 种 资源 。 

这 个 算法 执行 回 湖 ,， 试图 延 后 一 个 时 钟 周 期 再 对 强 连通 分 量 18,c,d| 进 行 调度 。 这 一 次 结 点 
; 被 安排 在 第 三 个 时 钟 周期 上 ,而 结 点 < 可 以 被 成 功 地 安排 在 第 4 个 时 钟 周期 上 。 但 是 , i d 
不 能 被 安排 在 第 5 个 时 钟 周期 上 。 也 就 是 说 , 在 能 够 被 3 整除 的 时 钟 周期 上 ,4 和 4 都 需要 第 一 
种 资源 。 请 注意 ,虽然 至 今 为 止 找到 的 两 个 冲突 都 发 生 在 除 以 3 的 余数 都 是 0 的 时 钟 位 置 上 , 但 
是 这 只 是 一 个 巧合 ; 在 其 他 的 例子 中 , 冲突 可 能 在 余数 为 1 或 2 的 时 钟 周期 上 发 生 。 

算法 再 次 延 后 一 个 时 钟 周期 尝试 对 强 连通 分 量 15,c,d| 进行 调度 。 但 是 , 前 面 讨论 过 ,当局 
动 间隔 是 3 个 时 钟 周期 时 ,这 个 强 连通 分 量 实际 上 永远 不 可 能 被 成 功 地 调度 ,因此 这 次 尝试 一 害 
全 失败 。 此 时 ,这 个 算法 放弃 尝试 , 并 试图 找到 一 个 启动 间隔 为 4 个 时 钟 的 调度 方案 。 这 个 算法 
最 终 在 第 6 次 尝试 时 找到 了 最 优 调度 方案 。 i 口 
10.5.9 ”对 流水 线 化 算法 的 改进 

算法 10. 21 是 一 个 相当 简单 的 算法 , 尽管 人 们 发 现 它 能 够 在 实际 的 目标 机 器 上 很 好 地 完成 任 
务 。 这 个 算法 中 的 要 素 包 括 : 

1) 使 用 一 个 模 数 资源 预约 表 来 检查 稳定 状态 下 的 资源 冲突 。 

2) 需要 计算 传递 依赖 关系 ,以 便 在 出 现 依赖 环 的 时 候 找到 各 个 结 点 可 以 被 调度 的 合法 范围 

3) 回潮 是 有 用 的 ， 而 关键 环 ( 即 给 出 了 启动 间隔 7 的 最 高 下 界 的 环 ) 上 的 结 点 都 必须 一 起 重 
新 调度 ， 因 为 它们 之 间 的 时 间 间 隔 是 没有 松弛 度 的 。 

有 很 多 种 方法 可 以 改进 算法 10.21。 比如 , 这 个 算法 花 了 一 段 时 间 才 发 现 对 于 简单 的 例子 
10 22 来 说 , 采用 3 个 时 钟 的 启动 间隔 是 不 可 行 的 。 我 们 可 以 首先 对 各 个 强 连 通 分 量 进行 独立 调 
E, 确定 当前 的 启动 间隔 对 于 各 个 分 量 是 否 可 行 。 

我 们 也 可 以 改变 结 点 被 调度 的 顺序 。 算 法 10. 21 中 使 用 的 顺序 有 一 些 不 利之 处 。 第 一 ,因为 
非 平凡 的 SCC 难以 调度 , 所 以 首先 对 它们 进行 调度 是 较 好 的 选择 。 第 二 , 有 些 寄存 器 的 生命 期 可 
能 不 需要 那么 长 。 因 此 期 望 能 够 使 定 值 位 置 靠近 使 用 位 置 。 可 行 方法 之 一 是 首先 调度 带 有 关键 
环 的 强 连 通 分 量 , 然后 向 两 端 扩展 调度 方案 。 
10. 5. 10” 模 数 变 量 扩展 

如 果 一 个 标量 变量 的 活跃 范围 处 于 循环 的 一 个 枯 代 之 内 ,那么 该 标量 变量 被 称 为 可 私有 化 
的 (privatizable) 。 换 句 话 说 ， 一 个 可 私有 化 变量 不 能 在 任何 闪 代 的 入 口 或 者 出 口 处 活跃。 这 些 变 
量 会 这 样 命名 的 原因 是 执行 一 个 循环 中 的 不 同 迁 代 的 各 个 处 理 器 可 以 拥有 这 些 变量 的 私有 拷贝， 
使 得 它们 不 会 互相 干扰 6 

变量 扩展 (variable expansion) 指 的 是 这 样 一 种 变换 技术 : 它 把 一 个 可 私有 化 的 标量 变量 转换 
成 为 一 个 数组 ,并 让 循环 的 第 ;个 迭代 读 写 第 ; 个 元 素 。 这 个 转换 消除 了 一 个 迁 代 中 的 读 运算 和 
后 一 个 迭代 中 的 写 运算 之 间 的 反 依赖 关系 ， 以 及 不 同 迁 代 的 写 运算 之 间 的 输出 依赖 关系 。 如 有 果 
所 有 的 穿越 循环 的 依赖 关系 都 可 以 被 消除 , 那么 循环 的 各 个 选 代 就 可 以 并 行 执行 。 

消除 穿越 循环 的 依赖 关系 也 就 消除 了 数据 依赖 图 中 的 环 , 这 样 可 以 大 大 提高 软件 流水 线 化 
的 效率 。 如 例 10. 15 所 示 , 我 们 不 需要 根据 循环 的 迭代 次 数 来 完全 扩展 可 私有 化 变量 。 同 一 时 间 
内 只 能 执行 少量 的 迭代 , 而 在 同一 时 刻 私有 变量 在 其 中 活跃 的 迭代 数量 更 少 。 因 此 , 同一 个 内 存 
位 置 可 用 于 存放 其 生命 周期 不 交 秋 的 多 个 变量 的 值 。 更 明确 地 讲 , 如 果 一 个 寄存 器 的 生命 周期 
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变量 分 配 g 个 寄存 器 ， 而 第 i 个 迭代 中 的 变量 使 用 第 (i mod 4) 个 寄存 器 。 我 们 把 这 种 转换 称 为 模 
数 变量 扩展 (modular variable expansion) 。 





存在 不 同 于 启发 式 的 方法 吗 ? 

我 们 可 以 把 同时 寻找 最 优 软件 流水 线 调度 方案 和 寄存 器 分 配方 案 的 问题 写成 一 个 整数 线 
性 规划 问题 。 虽 然 很 多 整数 线性 规划 问题 可 以 很 快 地 得 出 解 , 但 有 些 问 题 需要 特别 长 的 时 
间 。 在 编译 器 中 使 用 一 个 求解 整数 线性 规划 问题 的 程序 时 , 我们 必须 能 够 在 它 无 法 在 茶 个 预 
设 时 间 内 完成 解答 时 退出 求解 过 程 。 

这 个 方法 曾经 在 一 个 目标 机 器 上 (SGI R8000) 实 验 性 地 尝试 过 , 结果 发 现 规划 求解 器 可 
以 在 一 个 合理 的 时 间 内 为 大 部 分 试验 程序 找到 最 优 解决 方案 。 我 们 发 现 , 用 启发 式 方法 得 到 
的 调度 方案 和 最 优 解 相当 接近 。 这 个 结果 说 明 , 至少 对 于 那个 目标 机 器 , 使 用 整数 线性 规划 
方法 是 没有 什么 意义 的 。 从 一 个 软件 工程 师 的 角度 来 看 尤其 如 此 。 因 为 整数 线性 规划 求解 程 
序 可 能 不 会 按时 结束 , 在 编译 器 中 实现 某 种 启发 式 调度 程序 仍然 是 必要 的 。 一 旦 有 了 一 个 这 
样 的 启发 式 调度 器 ,也 就 不 需要 再 去 实现 一 个 基于 整数 规划 技术 的 调度 器 了 。 











使 用 模 数 变量 扩展 技术 的 软件 流水 线 化 。 
输入 : 一 个 数据 依赖 图 和 一 个 机 器 资源 描述 。 
输出 : 两 个 循环 , 一 个 经 过 软件 流水 线 化 处 理 , 另 一 个 没有 。 
方法 : 
1) 从 输入 的 数据 依赖 图 中 删除 和 可 私有 化 变量 相关 的 穿越 循环 的 反 依赖 关系 和 输出 依赖 
Be xo 
2) 使 用 算法 10. 21 对 第 一 步 得 到 的 数据 依赖 图 进行 软件 流水 线 化 。 令 7 是 已 经 找到 相应 调 
度 方案 的 启动 间隔 ,是 一 个 迭代 的 调度 方案 的 长 度 。 
3) 对 于 每 个 可 私有 化 变量 ,依据 得 到 的 调度 方案 计算 9,， 即 "所 需要 的 最 小 寄存 器 数目 。 
& Q = max,4,.0 
A) 生成 两 个 循环 : 一 个 经 过 软件 流水 线 化 的 循环 和 一 个 没有 被 流水 线 化 的 循环 。 被 软件 流 
水 线 化 的 循环 有 
b 
FE + Q -1 


个 迭代 的 拷贝 ,各 个 拷贝 之 间 相 距 了 个 时 钟 。 它 有 一 个 带 有 


(| 引路 
条 指令 的 序言 部 分 , 一 个 带 有 QT 条 指令 的 稳定 状态 和 一 个 具有 -7 条 指令 的 尾声 部 分 。 插 入 一 
个 从 稳定 状态 的 尾部 到 稳定 状态 顶端 的 循环 回归 指令 。 
分 配给 可 私有 化 变量 。 的 寄存 器 数目 是 
| fg; 如 果 Qmodg, =0 
| 16 香 则 
在 第 # 个 迭代 中 的 变量 使 用 的 是 被 分 配给 ”的 第 (;i mod 41) 个 寄存 器 。 
S n 为 源 代码 循环 中 表示 和 迭代 数目 的 变量 。 这 个 软件 流水 线 化 的 循环 被 执行 的 前 提 是 
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Ti = a +1 
Q 
因此 , BERKER IRAT IARE P ERE 


ee (ean + Qn, 如果 郊 三 [ad 
0 否则 
未 被 流水 线 化 的 循环 执行 的 迄 代数 目 是 ns =n -mo 
在 图 10.22 中 经 过 软件 流水 线 化 的 循环 中 , 上 =8, T=2 H 0 =2。 这 个 软件 流水 线 化 
的 循环 有 7 BRM IL, 其 中 的 序言 、 稳 定 状态 和 尾声 部 分 分 别 有 64.6 条 指令 。 令 为 源 代 
码 循环 中 的 迭代 次 数 。 这 个 软件 流水 线 化 的 循环 在 n=5 的 时 候 被 执行 ,在 这 种 情况 下 循环 回归 
分 支 被 执行 





循环 回归 分 支 的 执行 次 数 是 


l = ir 











次 , 且 软件 流水 线 化 的 循环 负责 执行 





个 源 代码 循环 中 的 迭代 。 口 

模 数 扩展 会 把 稳定 阶段 代码 的 大 小 增加 到 @ 倍 。 虽然 如 此 ,由 算法 10. 23 生成 的 代码 仍然 
是 相当 精简 的 。 在 最 坏 情 况 下 , 经 过 软件 流水 线 化 的 循环 的 指令 数目 是 单个 迭代 的 调度 方案 中 
指令 数目 的 三 倍 。 粗略 地 讲 , 把 用 来 处 理 零星 迭代 的 额外 循环 加 在 一 起 , 整个 代码 的 大 小 大 约 是 
原 代码 大 小 的 四 倍 。 这 个 技术 通常 应 用 于 紧凑 的 内 层 循环 , 因此 这 样 的 代码 增加 量 是 可 接受 的 。 

算法 10.23 可 以 使 用 更 多 的 寄存 器 来 使 代码 的 扩展 量 降 到 最 低 。 我 们 可 以 通过 生成 更 多 的 
代码 来 降低 对 寄存 器 的 使 用 。 如 果 我 们 使 用 一 个 具有 

T x LCM,4q, 
条 指令 的 稳定 状态 , 我 们 最 少 可 以 为 每 个 变量 " 使 用 v, 个 寄存 器 。 这 里 , LCM, 是 求解 所 有 9, 的 
最 小 公 倍数 ( 即 能 够 被 所 有 qo 整除 的 最 小 整数 ) 的 函数 , "的 取 值 范围 是 所 有 的 可 私有 化 变量 。 
遗憾 的 是 , 即使 对 少量 很 小 的 q, 值 ,最 小 公 倍 数 也 可 能 变 得 相当 大 。 
10.5.11 条 件 语句 

如 果 可 以 使 用 带 断 言 的 指令 , 我 们 可 以 把 控制 依赖 的 指令 转换 成 为 带 断 言 的 指令 。 带 断言 
的 指令 可 以 和 其 他 指令 一 样 进行 软件 流水 线 化 处 理 。 但 是 ,如 果 在 循环 体内 有 很 多 依赖 于 数据 
的 控制 流 , 那么 就 更 加 适合 使 用 10. 4 节 中 的 算法 进行 调度 。 

如 果 一 个 机 器 没有 带 断 言 的 指令 , 那么 可 以 使 用 下 面 描述 的 层次 结构 归 约 (hierarchical re- 
duction) 技术 来 处 理 少量 的 依赖 于 数据 的 控制 流 。 和 算法 10. 11 类 似 , 在 层次 结构 归 约 中 , 对 一 
个 循环 控制 结构 的 调度 是 从 肉 套 在 最 内 层 的 结构 开始 ,以 从 内 到 外 的 顺序 进行 调度 的 。 当 每 个 
结构 被 调度 时 , 整个 结构 被 归 约 为 一 个 结 点 。 这 个 结 点 代表 了 它 的 所 有 组 成 部 分 和 程序 的 其 他 
部 分 之 间 的 调度 约束 。 然 后 , 这 个 结 点 可 以 当 作 它 外 围 的 控制 结构 中 的 单个 结 点 进行 调度 。 当 
整个 程序 被 归 约 为 单个 结 点 的 时 候 , 调度 过 程 就 结束 了 。 
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当 处 理 一 个 带 有 “then” 分 支 和 “else” 分 支 的 条 件 语 句 时 , 我 们 首先 独立 地 对 各 个 分 支 进行 调 
度 。 然 后 : 

1) 整个 条 件 语句 的 约束 被 保守 地 设 定 为 来 自 两 个 分 支 的 约束 的 并 集 。 

2) 它 的 资源 使 用 情况 是 各 个 分 支 所 用 资源 的 最 大 值 。 

3) 它 的 先后 次 序 约束 是 各 个 分 支 中 此 类 约束 的 并 集 。 通 过 假设 两 个 分 支 都 被 执行 就 可 以 求 
得 这 个 约束 集合 。 

然后 , 这 个 结 点 就 可 以 和 其 他 结 点 一 样 进 行 调 度 。 需 要 生成 分 别 对 应 于 两 个 分 支 的 两 组 代 
码 。 任 何 被 安排 与 这 个 条 件 语句 并 行 执行 的 代码 都 需要 在 这 两 个 分 支 中 分 别 进 行 复 制 。 如 果 多 
个 条 件 语句 相互 交 丢 ,那么 对 并 行 执行 的 每 个 分 支 组 合 都 要 生成 单独 的 代码 。 
10. 5. 12 ”软件 流水 线 化 的 硬件 支持 

人 们 提出 了 特殊 的 硬件 支持 机 制 来 使 软件 流水 线 代 码 的 大 小 降 到 最 低 。 在 Itanium 体系 结构 
中 的 轮转 寄存 器 文件 (rotating register file) 就 是 这 样 的 一 个 例子 。 轮 转 寄 存 器 文件 有 一 个 基 寄 存 
器 (base register), 可 以 把 基 寄 存 器 中 的 内 容 加 到 代码 中 给 定 的 寄存 器 编号 来 得 到 实际 被 访问 的 
寄存 器 。 我 们 只 需要 在 每 个 迭代 的 边界 上 改变 基 寄 存 嚣 中 的 内 容 , 就 可 以 让 一 个 循环 中 的 不 同 
迭代 使 用 不 同 的 寄存 器 。Itanium 体系 结构 也 支持 广泛 的 带 断 言 指令 。 断 言 不 仅 可 以 把 控制 依赖 
转换 成 数据 依赖 , 它 也 可 以 用 来 避免 生成 序言 代码 和 尾声 代码 。 一 个 软件 流水 线 化 的 循环 体 中 
包含 了 所 有 在 序言 和 尾声 中 的 指令 。 我 们 只 需要 为 稳定 状态 生成 代码 ,并 适当 地 使 用 断言 来 抑 
制 多 余 的 运算 , 使 得 代码 的 运行 效果 就 像 是 存在 一 个 序言 和 一 个 尾声 。 

虽然 Itanium 的 硬件 支持 机 制 提高 了 经 软件 流水 线 化 的 代码 的 密度 , 我 们 必须 知道 这 种 支持 
机 制 可 不 便宜 。 因 为 软件 流水 线 化 技术 主要 用 于 最 内 层 循 环 , 被 流水 线 化 处 理 的 循环 往往 很 小 。 
原则 上 ,对 于 那些 预期 会 用 于 执行 很 多 软件 流水 线 化 的 循环 且 尽 可 能 降低 代码 大 小 又 很 重要 的 
BLES, 为 软件 流水 线 化 提供 专门 的 支持 机 制 是 合理 的 。 
10. 5. 13 10.5 节 的 练习 

练习 10. 5. 1: 在 例 10. 20 H, 我 们 说 明了 如 何 求 出 Alc 之 间 的 相对 时 钟 距 离 的 上 下 界 。 分 
别 @ 为 一 般 化 的 了 OX T=3, OX T=4, 计算 另外 五 对 结 点 的 上 下 界 。 

练习 10. 5.2: 图 10-31 显示 的 是 一 个 循环 的 循环 体 。a(R9 ) 这 样 的 地 址 是 内 存 位 置 , 其 中 a 
是 一 个 常数 , 而 R9 是 对 该 循环 的 迭代 进行 计数 的 寄存 器 。 因 为 对 
于 不 同 的 迭代 有 不 同 的 RO 的 值 , 所 以 可 以 假设 该 循环 的 每 个 迭代 
访问 不 同 的 位 置 。 使 用 例 10. 12 中 的 机 器 模型 ， 按照 下 面 的 方法 对 
图 10-31 中 的 循环 进行 调度 。 

1) 尽量 保持 各 个 迭代 紧 致 ( 即 在 每 个 算术 运算 之 后 只 引入 一 
个 nop 运算 ), 把 该 循环 展开 两 次 。 该 机 器 在 任意 时 钟 周 期 上 只 能 
做 一 次 加 载运 算 、 一 个 保存 运算 、 一 个 算术 运算 以 及 一 个 分 支 运 
算 。 在 不 破坏 上 面 约束 的 情况 下 ,调度 第 二 次 迭代 使 之 在 尽 可 能 早 。” 图 10-31 练习 10.5.2 的 
的 时 刻 开 始 。 机 器 代码 

2) 重复 (1) 部 分 , 但 是 把 这 个 循环 展开 三 次 。 同 样 ,在 遵守 机 器 资源 约束 的 情况 下 让 各 个 选 
代 尽 可 能 早 地 启动 。 

! 3) 在 遵守 机 器 约束 的 情况 下 构造 完全 流水 线 化 的 代码 。 在 这 一 部 分 , 可 以 在 必要 时 引入 
nop 运算 , 但 是 你 必须 每 两 个 时 钟 周期 启动 一 个 新 迭代 。 

练习 10. 5. 3: 某 一 个 循环 需要 5 个 加 载运 算 、7 个 保存 运算 和 8 个 算术 运算 。 假 设 有 这 样 一 


1) E: ID Rr SR9) 

2) ST b(R9), Ri 

3) LD R2, c(R9) 

4) ADD R3, R1, R2 
5) ST c(R9), R3 

6) SUB R4, R1, R2 
7) ST b(R9), R4 

8) BL R9, L 
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台 机 器 ， 它 的 每 个 运算 都 能 够 在 一 个 时 钟 周期 内 完成 ， 并 且 有 足够 的 资源 在 一 个 时 钟 周期 内 
执行 : 

1) 3 个 加 载运 算 , 4 个 保存 运算 和 5 个 算术 运算 。 

2) 3 个 加 载运 算 , 3 个 保存 运算 和 3 个 算术 运算 。 

请 问 对 于 上 面 的 两 种 情况 ， 这 个 循环 经 软件 流水 线 化 后 的 启动 间隔 最 小 是 多 少 ? 

| 练习 10. 5.4: 使 用 例 10. 12 中 的 机 器 模型 ， 为 下 列 循环 

peerage ae eed 


Ati] = BLi-1] + 1; 
Bi] = ALi-1] + 2; 


} 
寻找 最 小 的 启动 间隔 以 及 对 此 循环 的 各 个 迭代 的 统一 调度 方案 请 记 住 ; 对 和 迭代 的 计数 是 通过 
寄存 器 的 自动 增 一 运算 实现 的 ,不 需要 专门 的 对 for 循环 计数 的 运算 指令 。 

| 练习 10. 5. 5: 请 证 明 ， 如 果 每 个 运算 都 只 需要 一 个 单元 的 某 种 资源 , 算法 10. 19 总 能 够 找 
到 一 个 使 用 启动 间隔 下 界 的 软件 流水 线 调度 方案 。 

| 练习 10. 5. 6: 假设 有 一 个 结 点 集合 为 a、b\csd 的 有 环 的 数据 依赖 图 。 从 a 到 以 及 从 < 到 
4 都 有 标号 为 (0, 1) 的 边 ; 从 5 到 c 及 从 d 到 a 都 有 标号 为 (1,1) 的 边 。 此 外 , 再 没有 其 他 的 边 。 

1) 画 出 这 个 有 环 的 依赖 图 。 

2) 计算 记录 了 结 点 之 间 的 最 长 简单 路 径 的 表 。 

3) 如 果 启 动 间隔 了 的 值 为 2， 指出 最 长 简单 路 径 的 长 度 。 

4) 设 T=3, BR) 

5) 对 于 T=3 的 情况 , EIE abed 所 表示 的 各 条 指令 时 , 它们 之 间 的 相对 时 间 的 约束 是 
tA? 

| 练习 10.5.7: 假设 在 一 个 及 个 结 点 的 图 中 没有 长 度 为 正 的 环 , 给 出 一 个 O(n?) HAR 
该 图 中 最 长 简单 路 径 长 度 的 算法 。 提示: 修正 Floyd 的 最 短路 径 算法 ( 见 A. V. Aho 和 
J. D. Ullman, Foundations of Computer Science, Computer Science Press, New York, 1992). 

1) 练习 10. 5. 8: 假设 我 们 有 一 个 带 有 三 种 指令 类 型 的 机 器 ， 我 们 把 这 三 种 指令 称 作 AB 和 
C。 所 有 的 指令 都 需要 一 个 时 钟 周期 ， 并 且 该 机 器 可 以 在 每 个 时 钟 周期 执行 每 个 类 型 的 各 一 条 指 
令 。 假 设 一 个 循环 由 六 条 指令 组 成 , 每 种 两 个 ， 那么 一 个 软件 流水 线 能 够 以 2 作为 启动 间隔 执行 
这 个 循环 式 。 但 是 ， 这 六 条 指令 的 某 些 序列 要 求 插入 一 个 延 时 ， 而 另外 一 些 序列 需要 插入 两 个 延 
时 。 在 90 种 可 能 的 由 两 个 4 型 指令 、 两 个 B 型 指令 和 两 个 C 型 指令 组 成 的 序列 中 , 多 少 个 序列 
不 需要 延 时 ? 多 少 个 序列 需要 一 个 延 时 ?提示 : 在 这 三 类 指令 中 存在 对 称 性 , 因此 如 果 两 个 序列 
能 够 通过 交换 4.8 和 C 的 名 字 相 互 转换 ， 那么 它们 就 需要 同样 多 的 延 时 。 比 如 , ABBCAC 一 定 和 
BCCABA 一 样 。 
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。 体 系 结构 问题 : 被 优化 的 代码 调度 利用 了 现代 计算 机 体系 结构 的 一 些 特性 。 DORE AY DL at 
常常 允许 以 流水 线 方式 执行 代码 ， 也 就 是 多 条 指令 在 同一 个 时 刻 处 于 不 同 的 执行 阶段 。 
有 些 机 器 还 允许 多 条 指令 在 同一 个 时 刻 开 始 执行 。 

数据 依赖 : 在 调度 运算 指令 时 ， 我 们 必须 知道 这 些 指令 对 于 每 个 内 存 位 置 和 寄存 器 的 影 
响 。 如 果 一 条 指令 必须 在 另 一 指令 对 某 个 内 存 位 置 写 人 之 后 才 读 取 该 位 置 的 值 ， 那么 这 
两 条 指令 之 间 具 有 真 依赖 关系 。 如 果 有 一 个 对 同一 位 置 的 读 指令 之 后 的 写 指令 ， 那么 两 
条 指令 之 间 就 出 现 反 依赖 关系 ; 当 有 两 个 对 同一 位 置 的 写 指令 时 就 会 出 现 输出 依赖 。 


BABI TE ai 





o 消除 依赖 关系 :通过 使 用 附加 的 位 置 存放 数据 ， 可 以 消除 反 依 赖 和 输出 依赖 。 只 有 真 依 
赖 不 能 被 消除 , 并且 在 调度 代码 时 必须 保证 遵守 这 类 依赖 关系 。 
o 基本 决 的 数据 依赖 图 : 这 些 图 表示 了 一 个 基本 块 中 的 语句 之 间 的 时 间 安 排 约束 。 图 的 结 
点 对 应 于 这 些 语句 。 从 nn 到 m 的 标号 为 d ARH m 的 开始 时 刻 必须 比 n 的 开始 时 
刻 晚 至 少 d 个 时 钟 周期 。 
带 优 先 级 的 拓扑 排序 : 一 个 基本 块 的 数据 依赖 图 总 是 无 环 的 , 通常 有 很 多 个 与 这 个 依赖 
图 一 致 的 拓扑 排序 。 为 一 个 给 定 依赖 图 选择 较 好 的 拓扑 排序 的 启发 式 规则 之 一 是 首先 选 
择 具 有 最 长 关键 路 径 的 结 点 。 
列表 调度 : 给 定 一 个 数据 依赖 图 的 带 优先 级 的 拓扑 排序 , 我 们 可 以 按照 这 个 顺序 考虑 对 
结 点 的 调度 。 在 对 每 个 结 点 进行 调度 时 , 把 每 个 结 点 安排 在 最 早 的 满足 下 列 条 件 的 时 钟 
周期 上 : 满足 图 的 边 所 蕴涵 的 时 间 安 排 约 东 , 并 且 和 所 有 之 前 已 经 调度 好 的 结 点 的 调度 
方案 一 致 , 同时 满足 该 机 器 的 资源 约束 。 
基本 块 之 间 的 代码 移动 : 在 某 些 情况 下 , 可 以 把 一 些 语句 从 它 所 在 的 基本 块 移动 到 该 基 
本 块 的 前 驱 或 后 继 。 进 行 这 种 移动 的 好 处 在 于 有 机 会 在 新 的 位 置 上 并 行 执 行 新 指令 ,而 
在 原 位 置 上 可 能 没有 这 个 机 会 。 如 果 原 基本 块 和 新 位 置 之 间 没有 支配 关系 , 那么 有 必要 
在 某 些 路 径 上 插入 补偿 代码 ， 以 保证 不 管控 制 流 如 何 运 行 , 被 执行 的 总 是 相同 的 代码 
序列 。 
do-all 循环 : 一 个 do-all 循环 的 迭代 之 间 不 存在 依赖 关系 , 因此 各 个 迭代 都 可 以 并 行 运行 。 
do-all 循环 的 软件 流水 线 化 : 软件 流水 线 化 技术 充分 利用 了 目标 机 器 能 够 同时 执行 多 条 指 
令 的 能 力 。 通 过 调度 使 得 循环 的 各 个 迭代 的 开始 时 刻 只 相隔 很 短 的 时 间 。 在 此 过 程 中 可 
能 需要 在 迭代 中 插入 ino-op 指令 以 避免 迭代 之 间 产 生机 器 资源 冲突 。 结 果 , 循环 可 以 很 
快 地 执行 , 其 中 包括 序言 、 尾 声 和 (通常 ) 较 小 的 内 部 循环 。 
do-across 循环 : 很 多 循环 具有 从 每 个 迭代 到 后 续 迭 代 的 依赖 关系 。 这 些 循环 称 为 do- 
across 循环 。 
do-across 循环 的 数据 依赖 图 : 为 了 表示 一 个 do-across 循环 的 指令 之 间 的 依赖 关系 , 依赖 
图 中 的 边 的 标号 由 两 个 值 组 成 : 必须 的 延 时 ( 和 表示 基本 块 的 依赖 图 中 的 延 时 含义 相同 ) 
以 及 在 具有 依赖 关系 的 两 条 指令 之 间 相隔 的 迭代 数量 。 
循环 的 列表 调度 算法 : 为 了 调度 一 个 循环 , 我 们 必须 为 所 有 的 迭代 选择 同一 个 调度 方案 ， 
并 选择 启动 间隔 , 即 连续 迭代 的 启动 时 刻 的 间隔 。 这 个 算法 还 需要 获取 针对 循环 中 不 同 
指令 的 相对 调度 方案 的 约束 。 它 通过 计算 两 个 结 点 之 间 的 最 长 无 环 路 径 的 长 度 来 获得 这 
种 约束 。 算法 求 得 的 这 些 长 度 把 启动 间隔 作为 参数 , 因此 给 启动 间隔 设 定 了 一 个 下 界 。 
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第 11 章 ”并行 性 和 局 部 性 优化 


未 章 将 介绍 一 个 编译 器 如 何 增强 处 理 数组 的 计算 密集 型 程序 中 的 并 行 性 和 局 部 性 ， 以 便 提 
高 目标 程序 在 多 处 理 器 系统 上 的 远 行 速度 。 很 多 科学 .工程 和 商业 领域 的 应 用 对 计算 能 力 的 要 求 
是 永 无 正 境 的 。 这 些 例子 包括 气象 预报 , 用 于 药物 设计 的 蛋白 质 折叠 ， 用 于 设计 航空 推进 系统 的 
流体 动力 学 和 用 于 高 能 物理 中 强 相互 作用 研究 的 量子 色 动 力学 。 

加 快 计算 过 程 的 方法 之 一 就 是 使 用 并 行 技术 。 遗 憾 的 是 ， 开发 可 以 利用 并 行 机 器 的 软件 并 
不 是 容易 的 事情 。 把 计算 过 程 分 割 为 多 个 可 以 在 不 同 并 行 处 理 器 上 执行 的 单元 已 经 是 很 困难 的 
事情 了 ,但 是 这 样 的 分 割 还 不 一 定 能 保证 提高 速度 。 我 们 还 必须 把 处 理 器 之 间 的 通信 量 减 到 最 
小 ， 因 为 通信 开销 很 容易 使 并 行 代码 运行 得 甚至 比 串 行 代码 还 慢 ! 

尽 可 能 降低 通信 开销 可 以 被 当 作 是 提高 程序 的 数据 局 部 性 (data locality ) 的 一 个 特殊 情况 。 
二 般 来 说 ,如果 一 个 处 理 器 经 常 访问 它 最 近 使 用 的 同一 组 数据 ， 我 们 就 说 这 个 程序 具有 良好 的 数 
据 局 部 性 。 如 果 并 行 机 上 的 一 个 处 理 器 具有 良好 的 局 部 性 ， 它 就 不 需要 和 其 他 处 理 器 频繁 通信 。 
因此 , 并 行 性 和 数据 局 部 性 必须 放 在 一 起 考虑 。 数据 局 部 性 本 身 对 于 单个 处 理 器 的 性 能 也 是 很 
重要 的 。 现 代 处 理 器 的 内 存 层 次 结构 中 都 有 一 层 或 多 层 高 速 缓存 ， 一 次 内 存 访问 可 能 会 需要 几 
十 个 机 器 周期 ， 而 在 高 速 缓存 中 命中 的 运算 只 需要 几 个 机 器 周期 。 如 果 一 个 程序 没有 良好 的 数 
据 局 部 性 ， 并 经 常 在 缓存 访问 中 脱 靶 , 那么 它 的 性 能 就 会 受到 影响 。 

在 本 音 中 同时 处 理 并 行 性 和 数据 局 部 性 的 另 一 个 理由 是 它们 使 用 的 理论 相同 。 如 果 我 们 知 
道 如 何 优化 数据 局 部 性 , 也 就 知道 了 并 行 性 在 哪里 。 在 本 章 , 你 将 看 到 第 9 章 中 为 进行 数据 流 分 
析 而 使 用 的 程序 模型 对 并 行 化 和 局 部 性 优化 来 说 是 不 够 的 。 原 因 是 在 数据 流 分 析 中 的 工作 假设 
我 们 不 需要 区 分 到 达 二 个 给 定语 句 的 不 同 路 径 。 实 际 上 , 第 9 章 中 的 那些 技术 利用 了 不 需要 区 分 
同一 个 语句 的 (例如 , 在 循环 中 的 ) 不 同 执行 的 事实 。 为 了 实现 代码 并 行 化 ,需要 考虑 同一 语句 
的 不 同 动态 执行 实例 之 间 的 依赖 关系 ,以 决定 它们 是 否 可 以 在 不 同 处 理 器 上 同时 执行 。 

本 音 关 注 的 是 用 于 优化 某 一 类 数值 应 用 的 技术 。 这 类 应 用 使 用 数组 作为 数据 结构 , 并 且 以 
一 种 简单 且 规则 的 模式 访问 这 些 数据 结构 。 更 明确 地 说 , 我 们 研究 的 程序 中 包含 的 数组 访问 与 
外 围 循 环 的 下 标 变 量 之 间 具 有 仿 射 关系 。 例 如 , 如 果 i 和 j 是 外 围 循环 的 下 标 变量 , 那么 lil L] 
和 2[ 让 [+ 首都 是 仿 射 访问 。 如 果 关 于 一 个 或 多 个 变量 x1 tnn 的 函数 可 以 被 表示 为 一 个 常 
数 加 上 常数 乘 以 这 些 变量 的 和 , BI co + cjr +czx2 +t Henk ns 其 中 co, C1, C2, ts cn 是 常数 , AB 
么 这 个 函数 就 是 仿 射 的 。 仿 射 函 数 通 常 称 为 线性 函数 ,虽然 严格 地 讲 线性 函数 不 能 有 co 项 。 

下 面 是 这 个 领域 内 的 循环 的 一 个 简单 的 例子 : 


for Cit= 09 ai S 10; LTE 
Z(i] = 0; 
ii 


因为 这 个 循环 的 各 个 迭代 对 不 同 的 内 存 位 置 进行 写 运算 , 不 同 的 处 理 器 可 以 并 发 地 执行 不 同 的 
和 迭代 。 另 一 方面 , 如 果 有 另 一 个 语句 2Z[j] = 1 正在 执行 , 我 们 就 要 担心 i 是 否 可 能 和 j 相同 , 以 及 
如 果 相 同 的 话 , 要 按照 什么 顺序 来 执行 这 两 个 具有 相同 数组 下 标 值 的 语句 的 实例 。 

知道 哪些 迭代 可 能 指向 同一 个 内 存 位 置 是 很 重要 的 。 这 个 知识 使 我 们 可 以 描述 调度 代码 时 
必须 遵守 的 数据 依赖 不管 被 调度 的 代码 是 在 单 处 理 器 上 运行 还 是 在 多 处 理 器 上 和 运行。 我们 的 
目标 是 找到 二 个 遵守 所 有 数据 依赖 关系 的 调度 方案 ,使 得 访问 相同 内 存 位 置 或 高 速 缓存 线 的 运 
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算 尽 可 能 靠近 执行 ; 并 且 在 多 处 理 器 的 情况 下 , 把 这 些 代码 放 在 同一 个 处 理 器 上 执行 。 

本 章 中 给 出 的 理论 是 基于 线性 代数 和 整数 规划 技术 的 。 我 们 把 一 个 深度 为 n BR RE 
构 中 的 迭代 建 模 为 一 个 nn 维 多 面 体 。 该 多 面体 的 边界 用 代码 中 循环 的 界限 来 描述 。 仿 射 函 数 把 
每 个 迭代 映射 成 为 它 所 访问 的 数组 位 置 。 我 们 可 以 使 用 整数 线性 规划 技术 来 确定 是 否 存 在 可 能 
指向 同一 个 位 置 的 两 个 迭代 。 

我 们 在 这 里 讨论 的 代码 转换 方法 的 集合 可 以 分 成 两 类 : 位 射 分 划 (affine partitioning) 和 分 块 
(blocking)。 仿 射 分 划 把 迭代 的 多 面体 分 割 成 为 多 个 部 分 , 在 不 同 的 机 器 上 执行 各 个 部 分 , 或 者 
一 个 一 个 地 顺序 执行 各 个 部 分 。 男 一 方面 , 分 块 技 术 创 建 了 一 个 由 迭代 组 成 的 层次 结构 。 假 设 
有 一 个 以 逐 行 方式 扫描 整个 数组 的 循环 。 我 们 可 以 把 这 个 数组 分 成 多 个 块 , 并 且 逐 块 访问 其 中 
的 元 素 。 最 后 得 到 的 代码 由 遍历 这 些 块 的 外 层 循环 和 扫描 各 块 中 元 素 的 内 层 循环 组 成 。 线 性 代 
数 技术 用 来 确定 最 好 的 仿 射 分 划 和 最 好 的 分 块 方 案 。 

在 接 下 来 的 内 容 中 , 我 们 先 在 11. 1 节 中 概述 关于 并 行 计算 和 局 部 性 优化 的 概念 然后 , 在 
11.2 节 中 给 出 一 个 具体 例子 一 一 矩阵 乘法 。 这 个 例子 用 于 说 明 循环 转换 , 即 对 一 个 循环 内 的 计 
算 过 程 进行 重新 排序 , 是 如 何 既 提高 局 部 性 又 提高 并 行 化 效率 的 。 

11.3 节 到 11.6 节 给 出 了 循环 转换 所 必需 的 基本 信息 。11.3 节 介 绍 如 何 对 一 个 循环 嵌 套 结 
构 中 的 各 个 迭代 进行 建 模 ; 11.4 介绍 如 何 对 数组 下 标 函 数 建 模 。 这 类 函数 把 每 个 循环 迭代 映射 
到 被 该 迭代 访问 的 数组 位 置 ; 11.5 节 介 绍 如 何 使 用 标准 线性 代数 算法 来 确定 一 个 循环 中 的 哪些 
迭代 访问 了 相同 的 数组 位 置 或 高 速 缓存 线 ; 11. 6 节 说 明 如 何 找 到 一 个 程序 中 的 数组 引用 之 间 的 
所 有 数据 依赖 关系 。 

本 章 的 其 余部 分 应 用 这 些 基本 技术 来 进行 优化 。11. 7 节 首 先 考虑 一 个 比较 简单 的 问题 ， 即 
寻找 不 需要 同步 的 并 行 性 。 为 了 找到 最 佳 的 仿 射 分 划 方 案 , 我 们 只 需要 找到 满足 下 面 约束 的 解 : 
具有 数据 依赖 关系 的 运算 必须 被 分 配 到 同一 个 处 理 器 上 。 

当然 , 没有 多 少 程序 能 够 在 不 需要 任何 同步 的 情况 下 实现 并 行 化 。 因 此 , 在 11.8 节 到 
11.9.9 节 将 探讨 寻找 需要 同步 的 并 行 性 的 一 般 情况 。 我 们 引入 了 流水 线 化 的 概念 ,说明 如 何 寻 
找 能 够 达到 一 个 程序 所 允许 的 最 大 流水 线 化 程度 的 仿 射 分 划 。 我 们 将 在 11. 10 节 中 说 明 如 何 优 
化 数据 局 部 性 。 最 后 , 我 们 讨论 如 何 把 仿 射 变换 用 于 其 他 形式 的 并 行 性 。 


11.1 基本 概念 


本 节 介 绍 了 一 些 和 并 行 化 及 局 部 性 优化 相关 的 基本 概念 。 如 果 运 算 可 以 并 行 执行 , 它们 也 
可 以 为 了 其 他 目的 (比如 局 部 性 ) 而 重新 排序 。 反 过 来 ， 如 果 一 个 程序 中 的 数据 依赖 关系 决定 了 
到 个 程序 中 的 指令 必须 串 行 执 行 ， 这 个 程序 显然 不 具有 并 行 性 , 同时 也 没有 任何 机 会 对 指令 重新 
排序 以 提高 数据 局 部 性 。 因 此 ， 并行 化 分 析 也 可 以 寻找 可 用 的 机 会 , 为 了 提高 数据 局 部 性 而 进行 
移动 代码 。 

为 了 尽 可 能 降低 并 行 代码 之 间 的 通信 量 , 我 们 把 所 有 相关 的 运算 都 组 合 在 一 起 , 并 把 它们 分 
配给 同一 个 处 理 器 。 因 此 得 到 的 代码 必然 具有 数据 局 部 性 。 在 单 处 理 器 上 获得 良好 数据 局 部 性 
的 一 个 粗略 的 方法 是 让 该 处 理 器 顺序 执行 在 并 行 化 时 分 配给 各 个 处 理 器 的 代码 。 

在 本 节 中 , 我 们 首先 概述 并 行 计算 机 体系 结构 。 然 后 给 出 并 行 化 的 基本 概念 。 并 行 化 是 一 
种 可 以 引起 巨大 变化 的 转换 技术 ; 同时 会 介绍 一 些 对 并 行 化 有 用 的 概念 。 然 后 我 们 讨论 了 如 何 
把 这 些 类 似 的 考虑 用 于 优化 数据 局 部 性 。 最 后 , 我们 将 非 正 式 地 介绍 本 章 中 使 用 到 的 数学 概念 。 
11.1.1 多 处 理 器 

最 流行 的 并 行 机 体系 结构 是 对 称 多 处 理 器 (Symmetric MultiProcessor, SMP) 结构 。 高 性 能 个 
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人 计算 机 通常 有 两 个 处 理 器 ,而 很 多 服务 器 有 四 个 : 八 个 ,甚至 几 十 个 处 理 器 。 不 仅 如 此 ， 因 为 现 
在 已 经 能 够 实现 把 多 个 高 性 能 处 理 器 集成 
在 一 个 芯片 上 , 所 以 多 处 理 器 得 到 了 更 加 
广泛 的 应 用 。 

一 个 对 称 多 处 理 器 结构 中 的 各 个 处 理 
器 共享 同一 个 地 址 空间 。 进行 通信 时 ; 一 
个 处 理 器 把 数据 写 到 某 个 内 存 位 置 ， 然后 
由 其 他 处 理 器 来 读 取 。 对 称 多 处 理 器 的 名 
字 就 是 源 于 所 有 的 处 理 器 能 够 以 统一 的 访 
问 时 间 来 访问 系统 中 所 有 的 内 存 。 图 11-1 
给 出 了 一 个 多 处 理 器 的 高 层 体系 结构 。 各 
个 处 理 器 都 拥有 自己 的 第 一 层 、 第 二 层 高 
速 缓 存 , 有 时 甚至 拥有 第 三 层 高 速 缓存 。 图 11-1 对 称 多 处 理 器 体系 结构 
最 高 层 的 高 速 缓存 通过 通常 的 共享 总 线 连接 到 物理 内 存 。 

对 称 多 处 理 器 使 用 一 致 缓存 协议 ( coherent cache protocol) 来 对 程序 员 隐藏 高 速 缓存 的 存在 。 
在 这 样 的 协议 下 , 多 个 处 理 器 可 以 同时 保存 同一 高 速 缓存 线 的 多 个 拷贝 9, 前 提 是 它们 都 只 是 读 
取 数 据 。 当 一 个 处 理 器 想 向 一 个 高 速 缓存 线 写 数据 时 ,所 有 其 他 的 高 速 缓存 拷贝 都 被 删除 。 当 
一 个 处 理 器 请 求 的 数据 不 在 高 速 缓存 中 时 ， 该 请 求 会 向 外 传递 到 共享 总 线 , 并 从 内 存 或 其 他 处 理 
器 的 高 速 缓存 中 获取 数据 。 

一 个 处 理 器 和 另 一 个 处 理 器 通信 所 花 的 时 间 大 约 是 内 存 访问 时 间 的 两 倍 。 以 缓存 线 为 单位 
的 数据 必须 首先 从 源 处 理 器 的 高 速 缓 存 写 到 内 存 中 , 然后 再 从 内 存 取出 放 到 第 二 个 处 理 器 的 高 
速 缓存 中 。 你 可 能 认为 处 理 器 之 间 的 通信 相对 便宜 ,因为 它 只 需要 大 约 两 倍 于 内 存 访问 的 时 间 。 
但 是 , 必须 记 住 , 相对 于 在 高 速 缓存 中 命中 的 访问 运算 , 内 存 访问 已 经 非常 昂贵 了 一 一 内 存 访问 
可 能 慢 几 百倍 。 这 个 分 析 十 分 清楚 地 说 明了 高 效 并 行 化 和 局 部 性 分 析 之 间 的 相似 性 。 不 管 是 单 
独 工作 的 处 理 器 还 是 多 处 理 器 环境 下 的 处 理 器 , 要 使 它 高 效 工作 就 必须 使 它 能 够 在 高 速 缓存 中 找 
到 运算 所 需 的 大 部 分 数据 。 

在 21 世纪 早期 , 对称 多 处 理 器 的 设 
计 超 不 过 几 十 个 处 理 器 的 规模 ,原因 是 
受到 共享 总 线 或 任何 其 他 用 于 此 目的 的 
互联 设施 的 限制 。 它 们 在 速度 上 不 能 应 
对 不 断 增加 的 处 理 器 数量 。 为 了 使 得 处 
理 器 设计 可 不 断 扩大 规模 ,体系 结构 设 
计 师 们 又 在 内 存 层 次 结构 中 引入 了 新 的 
二 层 。 他 们 不 再 使 用 和 各 个 处 理 器 距离 
一 样 远 的 内 存 ,而 是 把 内 存 分 配给 各 个 
处 理 器 , 以 便 每 个 处 理 器 能 够 快速 访问 
它 的 局 部 内 存 , 如 图 112 所 示 。 因 此 远 图 11-2 分布 式 内 存 的 机 器 
程 内 存 成 为 内 存 层次 的 下 一 级 , 它们 的 总 量 要 比 局 部 内 存 大 , 但 是 访问 时 花费 的 时 间 也 更 长 。 和 














O 你 可 以 复习 一 下 7.4 节 中 对 高 速 缓存 和 高 速 缓存 线 的 讨论 。 
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内 存 体系 结构 设计 时 高 速 存储 设备 必然 容量 较 小 的 原理 类 似 , 支持 处 理 器 之 间 快 速 通信 的 机 器 
所 拥有 的 处 理 器 数量 也 必然 较 少 。 

有 两 种 不 同 的 带 有 分 布 式 内 存 的 并 行 机 : NUMA( NonUniform Memory Access, 不 一 致 内 存 访 
问 ) 机 器 以 及 消息 传递 机 器 。NUMA 体系 结构 为 软件 提供 了 一 个 共享 地 址 空间 ， 人 允许 处 理 器 通过 
读 写 共享 内 存 来 通信 。 然 而 , 在 消息 传递 机 器 上 的 处 理 器 有 各 自 的 地 址 空间 ,处 理 器 之 间 通 过 相 
互 传递 消息 来 通信 。 请 注意 , 虽然 为 共享 内 存 机 器 写 代码 要 相对 简单 , 但 任何 一 种 机 器 要 想 具 有 
好 的 性 能 ,都 要 求 软件 具有 良好 的 局 部 性 。 

11.1.2 应 用 中 的 并 行 性 

我 们 使 用 两 种 高 层次 的 度量 来 估计 一 个 并 行 应 用 性 能 运行 的 好 坏 : 并 行 性 覆盖 率 和 并 行 性 
粒度 , 前 者 指明 了 并 行 执行 的 计算 过 程 所 占 的 百分比 ; 后 者 指出 了 各 个 处 理 器 在 不 和 其 他 处 理 器 
通信 或 同步 的 情况 下 能 够 运行 的 计算 量 。 一 个 特别 有 吸引 力 的 并 行 化 目标 是 循环 : 一 个 循环 可 
能 有 很 多 个 迭代 , 并且 如 果 它 们 之 间 相 互 独立 , 我 们 就 找到 了 一 个 很 大 的 并 行 性 的 源头 。 

Amdahl 定律 

并 行 性 覆盖 率 的 重要 性 可 以 用 Amdahl 定律 简洁 地 表示 。Amdahl 定律 的 内 容 是 , 如果/ 是 被 
并 行 化 代码 的 比率 , 并 且 如 果 并 行 化 版 本 在 一 个 有 zp 个 处 理 器 的 机 器 上 运行 , 且 没 有 任何 通信 或 
者 并 行 化 开销 , 那么 此 时 的 加 速 比 是 : 

i 
A EUD) 
比如 ,如 果 有 一 半 的 计算 是 串 行 执行 的 , 那么 不 管 我 们 使 用 多 少 个 处 理 器 ,计算 过 程 最 多 能 够 以 
双 倍 速度 运行 。 如 果 我 们 有 4 个 处 理 器 , 可 达到 的 加 速 比 是 1.6。 即 使 并 行 化 覆盖 率 达到 90% , 
我 们 在 4 个 处 理 器 上 最 多 能 够 得 到 3 倍 的 加 速 比 ， 而 在 无 限 多 的 处 理 器 上 得 到 的 加 速 比 最 多 
#10. 

并 行 化 的 粒度 

理想 情况 是 一 个 应 用 的 全 部 计算 过 程 能 够 被 划分 成 为 很 多 粗 粒 度 的 独立 任务 ,因为 我 们 可 
以 直接 把 不 同 的 任务 分 配给 不 同 的 处 理 器 。 这 样 的 例子 之 一 是 SETI( Search for Extra Terrestrial 
Intelligence, 寻找 外 星 智 慧生 物 ) 项 目 , 这 个 实验 使 用 很 多 通过 Internet 相连 的 家 庭 计算 机 来 并 行 
分 析 射 电 望 远 镜 数据 的 不 同 部 分 。 每 一 个 工作 单元 只 需要 少量 的 输入 并 生成 少量 的 输出 , 并且 
可 以 独立 于 所 有 其 他 单元 完成 。 由 于 这 些 原因 , RI Internet 具有 相对 高 的 通信 延 时 和 低 带 宽 ， 
但 这 样 的 计算 工作 仍然 在 与 Internet 连接 的 机 器 上 运行 得 很 好 。 

大 部 分 应 用 要 求 处 理 器 之 间 有 更 多 的 通信 和 交互 , 但 仍然 支持 粗 粒 度 的 并 行 性 。 比 如 ,考虑 
一 个 Web 服务 器 , 它 负 责 响 应 大 量 独立 的 对 一 个 公共 数据 库 的 请 求 。 我 们 可 以 在 一 个 多 处 理 器 
机 器 上 运行 这 个 应 用 , 使 用 一 个 线程 来 实现 数据 库 访 问 , 并 使 用 其 他 线程 来 对 用 户 请 求 提供 服 
务 。 其 他 的 例子 包括 药物 设计 和 机 波动 力学 模拟 。 在 这 些 例子 中 ,人 们 可 以 独立 地 求解 针对 不 
同 的 参数 的 结果 。 在 模拟 的 时 候 ， 有 时 即使 对 于 一 组 参数 求解 也 会 花 很 长 时 间 , 因此 期 望 能 够 使 
用 并 行 化 技术 进行 加 速 。 当 一 个 应 用 中 的 可 用 并 行 性 的 粒度 降低 时 , 就 需要 更 好 的 处 理 器 之 间 
的 通信 支持 和 更 多 的 编程 工作 量 。 

很 多 运行 时 间 很 长 的 科学 及 工程 应 用 具有 简单 的 控制 结构 和 很 大 的 数据 集合 ,因此 它们 要 
比 上 面 讨论 的 应 用 更 容易 实现 更 细 粒 度 的 并 行 化 。 因 此 , 本 章 主 要 考虑 的 是 那些 用 于 数值 应 用 
的 技术 , 特别 是 那些 把 大 部 分 时 间 用 于 多 维 数组 中 的 数据 运算 的 应 用 。 下 面 我 们 就 探讨 一 下 这 
类 程序 。 
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11.1.3 循环 层次 上 的 并 行 性 

循环 是 并 行 化 的 主要 目标 , 在 使 用 数组 的 应 用 中 更 是 如 此 。 运 行 时 间 较 长 的 应 用 通常 具有 
大 型 数组 ， 从 而 产生 具有 很 多 迭代 的 循环 。 其 中 的 每 一 个 迭代 处 理 数 组 中 的 一 个 元 素 。 迭 代 之 
间 相 互 独立 的 循环 并 不 难 找到 。 我 们 可 以 把 这 类 循环 的 大 量 迭 代 分 配给 多 个 处 理 器 。 如 果 每 个 
迭代 的 工作 量 基 本 相同 , 那么 简单 地 在 处 理 器 之 间 平 均 分 配 迭 代 就 可 以 得 到 最 大 的 并 行 性 。 例 
11. 1 是 一 个 特别 简单 的 例子 , 它 说 明 我 们 如 何 利用 循环 层次 的 并 行 性 。 


下 面 的 循环 


for (S Or i < ny i++) { 
ZE J == ah: 
Zt, = ZOI Z]; 


计算 了 向 量 和 和 了 了 的 元 素 之 间 的 平方 差 , 并 把 它们 存放 到 数组 Z 中 。 这 个 循环 是 可 并 行 化 的 , A 
为 每 个 迭代 访问 不 同 的 数据 集合 。 我 们 可 以 在 具有 矿 个 处 理 器 的 计算 机 上 执行 这 个 循环 。 给 每 
个 处 理 器 赋予 唯一 的 站 p=0, 1, 2,，…，M -1, 并 让 每 个 处 理 器 执行 同样 的 代码 : 
b = ceil(n/M); 
for (i = b*p; i < min(n,b*(p+1)); i++) { 
ZU = XC YAT; 
ZC = Zi) * Zi); 
} 


我 们 把 这 个 循环 中 的 和 迭代 平均 分 配给 各 个 处 理 器 , 第 p PAPER ROT ACT ES p 组 迭代 。 请 
注意 , 迭代 数目 不 一 定 能 够 被 M 整除 , 因此 我 们 通过 在 程序 中 引入 一 个 求 最 小 值 的 运算 来 保证 





最 后 一 个 处 理 器 执行 的 时 候 不 会 越过 原来 的 循环 界限 。 口 
任务 层次 的 并 行 
有 可 能 在 二 个 循环 的 透 代 之 外 找到 并 行 性 。 比 如 , 我 们 可 以 把 两 个 不 同 的 函数 调用 或 两 


个 独立 的 循环 分 配给 两 个 处 理 器 。 这 种 形式 的 并 行 性 称 为 任务 并 行 性 (task parallelism) 。 和 
循环 层次 的 并 行 性 相 比 , 任务 层次 的 并 行 性 作为 一 个 并 行 性 来 源 的 吸引 力 较 弱 。 原 因 是 对 于 
每 个 程序 来 说 , 其 独立 任务 的 数量 是 固定 的 , 并且 不 能 随 着 数据 大 小 的 增加 而 增加 。 而 一 个 
典型 循环 的 迭代 次 数 则 会 随 数据 的 增加 而 增加 。 不 仅 如 此 , 这 些 任 务 的 大 小 通常 并 不 相等 ， 
因此 难以 让 所 有 的 处 理 器 在 所 有 时 间 都 有 事 可 做 。 














例 11. 1 中 显示 的 并 行 代码 是 一 个 SPMD( Single Program Multiple Data, 单程 序 多 数据 ) 程序 。 
所 有 的 处 理 器 都 执行 相同 的 代码 ， 只 是 这 些 代码 都 带 有 各 个 处 理 器 的 唯一 标识 作为 参数 ,因此 不 
同 的 处 理 器 完成 不 同 的 动作 。 通 常会 有 一 个 被 称 为 主 处 理 器 (master) 的 处 理 器 来 执行 计算 中 的 
所 有 串 行 部 分 。 在 到 达 代 码 中 已 并 行 化 的 部 分 时 ， 主 处 理 器 激活 所 有 从 处 理 器 (slave)。 所 有 从 
处 理 器 同时 执行 代码 中 已 经 被 并 行 化 的 区 域 。 在 每 个 并 行 化 代码 区 域 的 尾部 ,所 有 这 些 处 理 器 
参与 机 障 同步 ( Barrier Synchronization) 。 只 有 等 到 所 有 处 理 器 都 已 经 执行 完 它们 进入 一 个 同步 顶 
障 之 前 的 全 部 运算 之 后 ， 各 个 处 理 器 才 会 被 允许 离开 这 个 栅 障 并 执行 栅 障 之 后 的 运算 。 

如 果 我 们 只 是 把 类 似 于 例 11. 1 中 的 简单 循环 并 行 化 , 那么 得 到 的 代码 通常 具有 较 低 的 并 行 
性 覆盖 率 和 相对 较 细 的 并 行 性 粒度 。 我 们 倾向 于 把 一 个 程序 的 最 外 层 循环 并 行 化 , 因为 这 样 会 得 
到 最 粗 的 并 行 性 粒度 。 比 如 , 考虑 二 维 FFT 变换 的 应 用 , 它 在 一 个 nxn 的 数据 集 上 运行 。 这 个 
程序 对 各 行 数据 执行 n 次 FFT 变换 , 然后 再 对 各 列 数据 执行 n 次 FFT 变换 。 我 们 倾向 于 把 n 个 
独立 FET 变换 中 的 每 一 个 分 配给 一 个 处 理 器 ,而 不 是 使 用 多 个 处 理 器 协作 完成 一 次 FFT 变换 。 
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这 样 做 使 得 代码 容易 书写 , 算法 的 并 行 性 覆盖 率 达 到 100% , 并 且 代 码 具 有 很 好 的 数据 局 部 性 ， 
因为 在 计算 一 个 FFT 时 不 需要 进行 任何 通信 。 

很 多 应 用 没有 可 并 行 化 的 大 的 最 外 层 循环 。 然 而 , 这 些 应 用 的 执行 时 间 通 常 由 耗 时 的 内 核 
决定 。 这 些 内核 可 能 具有 几 百 行 代码 ,包含 了 不 同 嵌 套 层次 的 循环 。 有 时 可 以 单独 地 处 理 内核 
部 分 , 通过 集中 考虑 它 的 局 部 性 , 重新 组 织 它 的 计算 过 程 并 把 它 分 划 成 为 多 个 独立 的 单元 。 
11.1.4 数据 局 部 性 

在 对 程序 进行 并 行 化 的 时 候 , 需要 考虑 两 种 略微 不 同 的 数据 局 部 性 概念 。 当 同一 个 数据 在 
短 时 间 内 被 多 次 使 用 时 就 产生 了 时 间 局 部 性 (temporal locality) 。 当 位 置 相 近 的 不 同 数据 元 素 在 短 
时 间 内 被 使 用 的 时 候 就 产生 了 空间 局 部 性 (spatial locality) 。 空 间 局 部 性 的 一 个 很 重要 的 形式 是 
在 同一 个 高 速 缓存 线 中 出 现 的 所 有 数据 元 素 被 一 起 使 用 。 这 种 形式 之 所 以 重要 的 理由 是 当 需 要 
一 个 来 自 某 高 速 缓存 线 的 元 素 时 ; 这 个 高 速 缓存 线 的 所 有 元 素 都 会 被 加 载 到 高 速 缓存 中 。 如 果 
很 快 就 会 使 用 这 些 元 素 , 那么 它们 很 可 能 还 在 高 速 缓存 中 。 这 种 空间 局 部 性 的 效果 使 得 高 速 组 
存 脱 靶 的 概率 降 到 最 小 ,也 使 得 该 程序 得 到 了 较 好 的 加 速 比 。 

程序 的 内 核 经 常 可 以 使 用 多 种 不 同 的 方式 来 书写 。 它 们 之 间 在 语义 上 等 价 , 但 是 数据 局 部 
性 和 性 能 却 相差 很 大 。 例 11. 2 给 出 了 例 11. 1 中 的 计算 过 程 的 男 二 种 表示 方法 。 


11.2 oiii, 下面 的 代码 也 能 够 计算 得 到 向 量 X 和 Y 的 元 素 之 间 的 差 的 平方 。 
ni 

for (i = 0; ii< n; i++) 

zli] = Z[i] * Zi); 

第 一 个 循环 计算 元 素 之 间 的 差 ,第 二 个 循环 计算 差 的 平方 。 这 样 的 代码 经 常会 在 实际 程序 
HAI, 因为 这 就 是 我 们 为 向 量 机 (vector machine) 优化 程序 的 办 法 。 向 量 机 是 一 种 超级 计算 机 ， 
拥有 可 以 一 次 性 对 整个 向 量 进行 简单 算术 运算 的 指令 。 我 们 可 以 看 到 , 这 里 的 两 个 循环 在 例 
11.1 中 被 融合 (fuse) 为 一 个 循环 。 

我 们 已 经 知道 这 两 个 程序 完成 同样 的 计算 工作 , 那么 哪 一 个 程序 比较 好 呢 ? 例 11. 1 中 被 融 
合 在 一 起 的 循环 拥有 比较 好 的 性 能 ,因为 它 具 有 较 好 的 数据 局 部 性 。 每 个 差 值 一 生成 就 立刻 进 
行 平方 运算 。 实 际 上 ,我 们 可 以 将 差 值 存放 在 一 个 寄存 器 中 , 求 它 的 平方 , 并 把 结果 一 次 性 写 人 
内 存 位 置 5[ 训 。 反 过 来 ,本 例 中 的 代码 需要 获取 Zink, 并 对 它 写 两 次 。 不 仅 如 此 ， 如果 数 
组 的 大 小 比 高 速 缓存 大 , 那么 当 Z[ 站 在 这 个 例子 中 被 第 二 次 使 用 时 , 需要 从 内 存 中 重新 获取 这 
个 值 。 因此 ,这 个 代码 的 运行 速度 可 能 低 很 多 。 口 
假设 我 们 希望 把 按 行 存放 (回忆 一 下 6 4 3 节 ) 的 数组 Z 设置 为 全 零 。 图 11.3a 和 图 11.3b 
分 别 对 这 个 数组 进行 逐 列 和 逐 行 扫描 。 我 们 可 以 对 图 11-3a 中 的 循环 进行 变换 得 到 图 11.36 的 循环 , 
从 空间 局 部 性 的 角度 看 ,以 逐 行 方式 执行 置 零 运算 是 比较 好 的 ,因为 在 一 个 高 速 缓存 线 中 的 所 有 字 都 
被 顺序 置 零 了 。 在 逐 列 处 理 的 方法 中 , 虽然 每 个 高 速 缓存 线 都 被 外 层 循环 的 下 一 个 迄 代 复 用 , 但 当 列 
的 大 小 比 高 速 缓存 大 的 时 候 , 高 速 缓存 线 在 被 复 用 之 前 就 会 被 抽出 高 速 缓存 : 为 了 得 到 最 好 的 性 能 ， 
我 们 使 用 类 似 于 例 11.1 中 所 使 用 的 方法 , 把 图 11-3b 的 外 层 循环 并 行 化 ; 结果 如 图 11.36 所 示 。 O 

上 面 的 两 个 例子 解释 了 和 操作 数组 的 数值 应 用 相关 的 几 个 重要 性 质 : 

。 数组 代码 经 常 有 很 多 可 并 行 化 的 循环 。 

。 当 循环 具有 并 行 性 的 时 候 , 它们 的 迭代 可 以 按照 任意 的 顺序 执行 。 它 们 可 以 通过 重新 排 

序 大 幅 提 高 数据 局 部 性 。 
。 当 我 们 创建 出 大 的 相互 独立 的 并 行 计 算 单元 时 ;以 串 行 方式 执行 它们 往往 会 得 到 良好 的 
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数据 局 部 性 。 


for Gy O02 nt for (i = 03 i < i++ 


for G= 03.9 <n; JA) 
Z[i,j] = 0; 


for (i = 03 i < n; i++) 
ZEI a0 





a) 逐 列 将 一 个 数组 置 堆 b) 逐 行 将 一 个 数组 置 去 


b = ceil(n/M); 
for (i = b*p; i < min(n,b*(p+1)); i++) 


for <j = 07 3) < 和 j++) 
Zi, jl] = 0; 








c) 并 行 地 按照 逐 行 方式 将 一 个 数组 置 零 
图 11-3 ， 将 一 个 数组 置 零 的 顺序 代码 和 并 行 代码 


11.1.5 仿 射 变换 理论 概述 

编写 正确 且 高 效 的 串 行程 序 是 困难 的 , 编写 正确 且 高 效 的 并 行程 序 则 更 加 困难 。 编 写 的 难 
度 随 着 所 利用 的 并 发 性 粒度 的 降低 而 增长 。 我 们 在 上 面 看 到 过 , 程序 员 必 须 注意 数据 局 部 性 以 
获取 高 性 能 。 此 外 , 把 一 个 已 有 的 串 行程 序 并 行 化 的 任务 是 极端 困难 的 。 找 出 程序 中 的 所 有 依 
赖 关系 很 困难 ， 当 这 个 程序 并 不 是 我 们 所 熟悉 的 类 型 时 尤其 如 此 。 调 试 一 个 并 行程 序 也 很 困难 ， 
因为 错误 可 能 是 不 确定 的 。 

在 理想 情况 下 , 一 个 并 行 的 编译 器 自动 地 把 普通 的 串 行 程序 翻译 成 高 效 的 并 行程 序 , 并 对 这 
些 程序 的 局 部 性 进行 优化 。 遗 憾 的 是 , 编译 器 并 不 知道 有 关 这 个 应 用 的 高 层 知 识 , 它 只 能 保持 原 
算法 的 语义 , 而 这 些 算法 未 必 适 合 进 行 并 行 化 。 而 且 , 程序 员 也 可 能 随意 地 做 出 选择 , 结果 限制 
了 程序 的 并 行 性 。 

一 些 Fortran 数值 应 用 显示 了 并 行 化 和 局 部 性 优化 的 成 功 。 这 些 应 用 以 仿 射 访问 的 方式 对 数 
组 进行 操作 。 因 为 没有 指针 和 指针 运算 ， 所 以 对 Fortran 的 分 析 相 对 容易 。 请 注意 , 不 是 所 有 的 
应 用 都 有 仿 射 访问 。 最 值得 注意 的 是 , 很 多 数值 应 用 是 在 稀疏 矩阵 上 运算 的 。 这 些 和 矩阵 的 元 素 
是 通过 另 一 个 数组 间接 访问 的 。 本 章 关注 的 是 内 核 的 并 行 化 和 优化 ; 这 些 内 核 通常 由 几 十 行 代 
码 组 成 。 

如 例 11.2 和 例 11. 3 所 示 , 并 行 化 和 局 部 性 优化 需要 我 们 考虑 一 个 循环 的 不 同 实例 以 及 实例 
之 间 的 关系 。 这 个 情况 和 数据 流 分 析 有 着 很 大 的 不 同 。 在 数据 流 分 析 中 , 我 们 把 所 有 实例 的 相 
关 信 息 组 合 在 一 起 考虑 。 

对 于 带 有 数组 访问 的 循环 的 优化 问题 , 我 们 使 用 三 种 类 型 的 空间 。 每 个 空间 可 以 看 成 是 一 
维 或 多 维 栅 格 中 的 点 集 。 

1) 迭代 空间 (iteration space) 是 在 一 次 计算 过 程 中 动态 执行 实例 的 集合 ,也 就 是 各 个 循环 下 
标的 取 值 的 组 合 。 

2) 数据 空间 (data space) 是 被 访问 的 数组 元 素 的 集合 。 

3) 处 理 器 空间 (processor space) 是 系统 中 的 处 理 器 的 集合 。 通 常情 况 下 , 这些 处 理 器 使 用 整 
数 或 者 整数 向 量 进行 编号 ,以便 相互 区 分 。 

优化 问题 的 输入 是 各 个 迭代 被 执行 的 串 行 顺序 以 及 一 个 仿 射 的 数组 访问 函数 (例如 ，X[i,j+ 
1] )。 这 个 函数 描述 了 迭代 空间 中 的 哪个 实例 访问 数据 空间 中 的 哪个 元 素 。 

这 个 优化 的 输出 也 是 用 仿 射 函数 表示 的 , 它 定义 了 每 个 处 理 器 在 什么 时 候 做 什么 事情 。 为 
了 指明 每 个 处 理 器 所 做 的 工作 , 我 们 使 用 一 个 仿 射 函数 把 原 迭 代 空 间 中 的 实例 映射 到 各 个 处 理 
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器 上 。 为 了 描述 什么 时 候 执行 迭代 , 我 们 使 用 一 个 仿 射 函数 把 迭代 空间 中 的 实例 映射 成 为 一 个 
新 的 顺序 。 通 过 分 析 程 序 中 的 数组 访问 函数 所 蕴涵 的 数据 依赖 关系 和 复 用 模式 , 就 可 以 得 到 调 


度 方案 。 
下 面 的 例子 将 说 明 上 述 三 个 空间 一 一 迭代 空间 数据 空间 和 处 理 器 空间 。 它 也 非 正式 地 介绍 


使 用 这 些 空间 来 并 行 化 代码 时 涉及 的 重要 概念 和 需要 解决 的 问题 。 在 后 面 的 各 节 中 将 详细 介绍 
这 些 概念 。 
加 四 11-4 解释 了 下 面 程序 中 用 到 的 不 同 空间 和 这 些 空间 之 间 的 关系 。 


float Z[100]; 























for (i = 0; i < 10; i++) 数据 访问 的 区 域 
Z[i+lo] = Z[i]; = > 

这 三 个 空间 和 它们 之 间 的 映射 如 下 : ie 过 19 20 

1) AREN: RRA EE + Pas 
代 的 集合 。 各 个 迭代 的 ID 通过 循环 下 标 Tar 
变量 的 取 值 给 出 。 一 个 深度 为 d 的 循环 ala 
RAY BIA d 层 柑 套 的 循环 ) 有 d 个 BAER is ends 
下 标 变 量 , 因此 被 建 模 为 一 个 d 维 空间 。 PRE 
迭代 空间 通过 循环 下 标 变量 的 上 下 界 来 7 Y 
限定 。 这 个 例子 的 循环 定义 了 一 个 由 10 ”处理 器 空间 ac ; 
个 和 迭代 组 成 的 一 维 空间 。 空 间 中 的 迭代 
用 循环 下 标 变量 的 值 : i =0, 1, …, 9 图 114 例 11.4 的 迭代 空间 、 数 据 空 间 和 处 理 器 空间 


表示 。 

2) 数据 空间 ; 数据 空间 由 数组 声明 直接 给 出 。 在 这 个 例子 里 , 数组 中 的 元 素 用 a =0, 1,… 
99 作为 下 标 。 虽 然 所 有 的 数组 在 一 个 程序 的 地 址 室 间 中 是 线性 存放 的 , 我 们 还 是 把 n 维 向 量 当 
ME n ERR, 并 假设 各 个 下 标 总 是 在 它们 的 界限 之 内 。 当 然 , 这 个 例子 里 的 数组 是 一 维 的 。 

3) 处 理 器 空间 : 在 我 们 开始 并 行 化 时 , 假设 系统 中 有 无 限 多 个 虚拟 处 理 器 。 这 些 处 理 器 以 
多 维 空间 的 方式 进行 组 织 , 每 一 个 维度 对 应 于 我 们 试图 并 行 化 的 循环 嵌 套 结构 中 的 一 个 循环 。 
在 并 行 化 完成 之 后 ,如果 我 们 拥有 的 物理 处 理 嚣 少 于 虚拟 处 理 器 , 就 把 虚拟 处 理 器 等 分 成 多 个 
块 , 每 一 块 分 配给 一 个 物理 处 理 器 。 在 这 个 例子 中 , 我 们 只 需要 10 个 处 理 器 , 循环 的 每 一 个 迭代 
分 配 一 个 处 理 器 。 在 图 11-4 中 ， 我 们 假设 处 理 器 被 组 织 成 一 个 一 维 空间 且 用 0, 1, …, 9 进行 纺 
号 。 循 环 的 第 i 个 迭代 被 分 配给 处 理 器 i。 假 如 只 有 五 个 处 理 器 , 我 们 可 以 把 迭代 0 和 1 分 配给 
处 理 器 0, 迭代 2 和 3 分 配给 处 理 器 1, 以 此 类 推 。 因 为 兴 代 是 独立 的 , 所 以 只 要 五 个 处 理 器 中 的 
每 一 个 分 得 两 个 迭代 , 我 们 怎么 进行 分 配 并 不 重要 。 

4) 念 射 数组 下 标 函 数 : 代码 中 的 每 个 数组 访问 都 描述 了 一 个 从 迭代 室 间 中 的 迭代 到 数据 空 
间 中 的 数组 元 素 的 映射 。 如 果 这 个 访问 函数 是 把 各 个 循环 下 标 变量 乘 以 常量 并 求 和 , 然后 加 上 
一 些 常量 值 , 那么 这 个 函数 就 是 仿 射 的 。 本 例 中 的 两 个 数组 下 标 函 数 ;+ 10 和 i 都 是 仿 射 的 。 我 
们 可 以 根据 访问 函数 求 出 被 访问 数据 的 维度 (dimension)。 在 本 例 中 ， 因为 每 个 下 标 函数 只 4 有 一 
个 循环 变量 , 所 以 被 访问 数组 元 素 的 空间 是 一 维 的 。 

5) 仿 射 分 划 : 我 们 使 用 二 个 仿 射 函 数 把 一 个 迭代 空间 中 的 各 个 迭代 分 配给 处 理 器 空间 中 的 
各 个 处 理 器 , 由 此 把 一 个 循环 并 行 化 。 在 我 们 的 例子 中 , 我 们 直接 把 迭代 ; 分 配给 处 理 器 i, 也 可 
以 使 用 仿 射 函 数 来 指定 一 个 新 的 执行 顺序 。 如 果 我 们 希望 以 相反 的 顺序 串 行 地 执行 上 面 的 循环 ， 
那么 可 以 用 一 个 仿 射 表达 式 10 -i 明确 指定 排序 函数 。 这 样 , 第 轧 个 迭代 就 是 被 第 一 个 执行 的 迭 
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代 , 以 此 类 推 。 

6) 被 访问 数据 的 区 域 : 知道 一 个 迭代 所 访问 数据 的 区 域 有 助 于 找到 最 好 的 仿 射 分 划 。 把 迭 
代 空 间 的 信息 和 数组 下 标 函 数 结合 起 来 , 我 们 就 可 以 得 出 被 访问 数据 的 区 域 。 在 本 例 中 ， 数组 访 
间 Z[i+10] 触 及 的 空间 是 |al10<a<20|, 而 数组 访问 Z[ 让 触及 的 空间 是 |al0<a<10|。 

7) 数据 依赖 : 为 了 确定 被 处 理 的 循环 是 否 可 被 并 行 化 , 我 们 需要 知道 在 各 个 迭代 之 间 是 否 
存在 数据 依赖 关系 。 在 这 个 例子 中 , 我 们 首先 考虑 该 循环 中 的 写 访问 之 间 的 依赖 关系 。 因 为 访 
问 函 数 Z[i+10] 把 不同 迭代 映射 到 不 同 的 数组 位 置 , 不 同 迭 代 向 数组 写 数据 的 顺序 上 不 存在 依 
赖 关系 。 那 么 在 读 访 问 和 写 访问 之 间 存 在 依赖 关系 吗 ? 因为 只 有 2Z[10], Z[11]，…, 2Z[19]( 通 
过 访问 Z[i+10]) 被 写 , 而 只 有 ZLO], Z[1], =, Z[9]( 通 过 访问 Z[ 门 ) 被 读 , 因此 一 个 读 访 问 
和 二 个 写 访问 的 相对 顺序 不 存在 依赖 关系 。 因 此 , 这 个 循环 是 可 并 行 化 的 。 也 就 是 说 , 这 个 循环 
的 各 个 迭代 独立 于 其 他 所 有 的 迭代 , 我 们 可 以 并 行 地 执行 这 些 迭 代 , 或 者 按照 我 们 选择 的 任意 顺 
序 执行 这 些 迭 代 。 但 是 请 注意 , 如 果 我 们 做 一 些 细微 的 改动 , 比如 把 循环 下 标 i 的 上 界 改 成 10 或 
ZEK, 那么 就 会 存在 依赖 关系 。 因 为 数组 Z 的 某 些 元 素 会 在 一 个 迭代 中 被 写 , 然后 在 10 TK 
代 之 后 被 读 。 在 那 种 情况 下 , 这 个 循环 不 能 被 完全 地 并 行 化 , 我 们 将 不 得 不 仔细 考虑 如 何在 处 理 
器 之 间 分 配 兴 代 , 以 及 如 何 对 迭代 进行 排序 。 回 

把 并 行 化 问题 写成 多 维 空间 和 这 些 空间 之 间 的 仿 射 映射 使 得 我 们 可 以 使 用 标准 的 数学 技术 
来 解决 并 行 化 和 局 部 性 优化 问题 。 比 如 , 可 以 通过 使 用 Fourier-Motzkin 消除 算法 消除 相应 的 变 
量 , 找 出 被 访问 数据 的 区 域 。 已 经 证 明 数 据 依赖 性 和 整数 线性 规划 问题 等 价 。 最 后 ,寻找 仿 射 分 
划 的 问题 则 对 应 于 对 一 组 线性 约束 求解 。 如 果 你 不 熟悉 这 些 概 念 也 不 用 着 急 ， 因 为 从 11. 3 市 开 
始 将 对 这 些 概 念 进行 解释 。 


11.2 EERE: 一 个 深入 的 例子 


我 们 将 使 用 一 个 较 大 的 例子 来 介绍 并 行 编译 器 所 使 用 的 很 多 技术 。 在 本 节 中 , 我们 将 研究 
大 家 熟悉 的 矩阵 相 乘 算法 ,以 说 明 即 使 对 一 个 简单 且 易 于 并 行 化 的 程序 进行 优化 也 不 是 轻 而 易 
举 的 事 。 我 们 将 看 到 代码 改写 可 以 如 何 提高 数据 局 部 性 。 也 就 是 说 ， 和 选择 直接 运行 该 程序 相 
比 ， 处 理 器 只 需要 通过 少 得 多 的 (根据 不 同 的 体系 结构 ， 和 全 局 内 存 或 其 他 处 理 器 之 间 的 ) 通信 
量 就 可 以 完成 它们 的 工作 。 我 们 也 将 讨论 如 何 利用 可 以 存放 多 个 连续 数据 元 素 的 高 速 缓 存 线 的 
特性 来 改进 像 矩 阵 乘法 这 样 的 程序 的 运行 时 间 。 

11.2.1 矩阵 相 乘 算法 

在 图 11-5 中 , 我 们 看 到 一 个 典型 的 矩阵 乘法 程序 8 。 它 的 输入 是 两 个 ”xz WER X M Y, 

它 产 生 的 输出 存放 在 第 三 个 ”xm 矩阵 2 中 。 注 
B, Z, ERZES AB ILM TCR |7 G70 isa 六 


fon (5,5 Oi < naj 








pe r 

E 11-5 中 的 代码 生成 双 个 结果 , 每 个 结果 都 uW ZR hr IN kih 
是 矩阵 下 的 某 行 和 矩阵 工 的 某 列 的 内 积 。 显 然 ， 
矩阵 了 的 每 一 个 元 素 的 计算 都 是 独立 的 ,因此 可 图 11-5 “基本 的 矩阵 相 乘 算法 


O 在 本 章 中 的 程序 中 ,我 们 通常 将 使 用 C 语言 的 语法 , 但 是 为 了 使 得 多 维 数组 访问 (这 是 本 章 大 部 分 内 容 的 中 心 问 
题 ) 的 代码 更 加 易于 理解 , 我 们 将 使 用 Fortran 风格 的 数组 访问 , 也 就 是 说 , 使 用 Z[i, 站 而 不 是 ZLi) [7]。 
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以 并 行 执行 。 

的 值 越 大 ,算法 访问 各 个 元 素 的 次 数 就 越 多 。 也 就 是 说 ,这 三 个 矩阵 中 有 372 个 位 置 , 但 
是 这 个 算法 执行 mw 次 运算 ,每 次 运算 把 蕊 的 一 个 元 素 和 了 的 一 个 元 素 相 乘 并 把 乘积 加 到 2 的 二 
个 元 素 中 。 因 此 算法 是 计算 密集 型 的 , 从 原则 上 来 讲 内 存 访问 不 应 该 成 为 瓶颈 。 

矩阵 乘法 的 串 行 执行 

我 们 首先 考虑 这 个 程序 在 单 处 理 器 上 顺序 运行 时 是 如 何 工 作 的 。 最 内 层 循 环 读 写 Z 的 同一 
个 元 素 , 并 使 用 XX 的 一 行 和 YY 的 一 列 。 可 以 很 容易 地 把 Z[i, 放 放 到 一 个 寄存 器 中 , 不 需要 进行 内 
存 访问 。 不 失 一 般 性 , 假设 这 个 矩阵 是 按 行 存放 的 , 并 假设 c 是 高 速 缓存 线 中 的 数组 元 素 的 
PK. 

图 11-6 给 出 了 当 我 们 执行 图 11-5 中 的 外 层 循环 的 一 个 迭代 时 的 访问 模式 。 这 张 图 显示 的 是 
第 一 个 迭代 的 情况 , 此 时 i=0。 每 次 我 们 从 义 
的 第 一 行 的 一 个 元 素 移动 到 下 一 个 元 素 时 ， 
都 会 访问 Y 的 某 一 列 中 的 各 个 元 素 。 在 
图 11-6 中 可 以 看 到 假设 的 将 各 个 矩阵 组 织 成 
高 速 缓存 线 的 方法 。 也 就 是 说 ,每 个 小 矩形 
表示 了 一 个 存放 四 个 数组 元 素 的 高 速 缓存 线 
































( 即 在 此 图 中 , c=4 Hn =12)。 lm | 
对 XX 的 访问 几乎 没有 增加 高 速 缓存 的 负 

担 外 的 一 行 只 分 布 在 we 个 高 速 缓存 线 中 。 x i 

如 果 这 一 行 元 素 可 以 被 一 起 放 到 高 速 缓存 中 ， 图 11-6 在 和 矩阵 乘法 中 的 数据 访问 模式 


对 于 一 个 给 定 的 下 标 i 的 值 只 会 发 生 n/c 次 高 速 缓存 脱 靶 ,而 整个 的 脱 革 数量 在 最 少 情况 下 为 
m/c( 为 方便 起 见 , 我 们 假设 可 以 被 。 HEE) 。 

但 是 , 当 使 用 XX 的 一 行 时 , RAE AIT YAR. aR, 当 j30 时 ， 
内 层 循环 把 的 整个 第 一 列 都 搬 到 了 高 速 缓存 中 。 请 注意 , 该 列 的 所 有 元 素 存 放 在 个 不 同 的 高 
速 缓存 线 中 。 如 果 高 速 缓 存 大 到 (或 者 小 到 ) 可 以 存放 所 有 这 个 高 速 缓 存 线 ， 并且 没 有 对 高 
速 缓存 的 其 他 使 用 使 得 某 些 高 速 缓存 线 被 清除 出 高 速 缓 存 , 那么 当 需 要 了 的 第 二 列 时 ,对 应 于 
/=0 的 列 仍然 在 高 速 缓存 中 。 在 此 情况 下 , 在 j=c 之 前 就 不 会 产生 次 对 了 的 脱 靶 。 当 1 = < 时 ， 
我 们 需要 把 对 应 于 了 的 另 一 组 完全 不 同 的 高 速 缓 存 线 载 人 到 高 速 缓存 中 。 因 此 , 完成 外 层 循环 
的 第 一 个 迭代 ( 即 i=0) 所 碰 到 的 高 速 缓存 脱 靶 次 数 在 n2/c 到 n? 之 间 。 具 体 的 脱 寺 次 数 取决 于 了 
的 高 速 缓存 线 列 能 否 从 第 三 个 循环 的 一 次 迭代 存活 到 下 一 个 迭代 。 

不 仅 如 此 ， 当 我 们 完成 := 1,2,… 外 层 循环 时 , 在读 取 工 的 元 素 时 可 能 会 碰 到 更 多 的 高 速 组 
存 脱 靶 ， 也 可 能 完全 没有 脱 丢 。 如 果 高 速 缓存 大 到 可 以 把 工 的 所 有 n2/c 个 高 速 缓存 线 一 起 存放 
在 高 速 缓存 中 ,那么 就 不 会 再 碰 到 任何 脱 靶 。 因 此 ,整个 脱 靶 次 数 是 222/e,， 一 半 在 访问 下 时 发 
E, 男 一 半 在 访问 Y 时 发 生 。 但是, 如 果 目 标 机 器 的 高 速 缓存 只 能 存放 了 的 一 列 , 而 不 是 全 部 了 
那么 每 次 执行 外 层 循环 的 一 个 迭代 时 , 我们 需要 把 了 的 所 有 元 素 再 次 载 入 到 高 速 缓存 中 也 就 
是 说 ,高 速 缓存 脱 靶 的 次 数 是 n/c + n3/o, 其 中 的 第 一 项 是 访问 基 时 的 脱 革 次数, 而 第 二 项 是 访 
问 工 时 的 脱 轰 次 数 。 在 最 坏 情况 下 , 如 果 我 们 甚至 不 能 把 Y 的 一 列 一 起 存放 在 高 速 缓存 中 , IA 
外 层 循环 的 每 次 迭 代 都 有 n? 个 高 速 缓存 脱 革 ,总 计 有 w/e + ma KAE, 

逐 行 并 行 化 

现在 我 们 考虑 可 以 如 何 使 用 多 个 处 理 器 ( 比如 说 p 个 ) 来 加 快 图 11.5 中 程序 的 执行 。 一 个 很 
显然 的 并 行 化 矩阵 乘法 的 方法 是 把 Z 的 各 行 分 配给 不 同 的 处 理 器 。 每 处 处 理 器 负责 n/p 个 连续 
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的 行 (为 方便 起 见 ,我们 假设 可 以 被 5 整除 )。 通 过 这 样 分 配 工作 量 , 每 个 处 理 器 只 需要 访问 蚌 
E X AO Z GY n/p IF, 但 是 要 访问 整个 了 矩阵 。 每 个 处 理 名 将 计算 Z 的 mw/p 个 元 素 。 为 了 计算 得 
到 这 些 元 素 , 它 需要 进行 四 各 次 乘 -加 法 运算 。 

这 样 做 之 后 , 虽然 计算 时 间 减 少 和 5 成 正比 , 但 通信 开销 的 增长 实际 上 和 p 成 正比 。 也 就 是 
说 , 每 个 p 处 理 器 必须 读 取 n/p A X WTR, 但 是 要 读 取 了 的 所 有 n 个 元 素 。 必 须 被 加 载 到 这 
个 处 理 器 的 高 速 缓存 中 的 高 速 缓存 线 的 总 数 最 少 为 /ec + pr? Vc， 这 两 项 分 别 对 应 于 加 载 和 
加 载 了 副本 的 数量 。 当 的 值 趋 近 于 郊 时 ,计算 时 间 变 为 0("2) , 但 是 通信 开销 为 0(m ) 。 也 就 
是 说 , 在 内 存 和 处 理 器 高 速 缓存 之 间 移动 数据 的 总 线 成 为 性 能 瓶 诺 。 因 此 ,对 于 给 定 的 数据 布局 
而 言 , 使 用 大 量 的 处 理 器 来 平分 计算 量 实际 上 会 降低 计算 速度 , 而 不 是 加 快 计算 速度 。 

11. 2.2 优化 

图 11-5 中 的 矩阵 相 乘 算 法 说 明了 这 样 的 事实 : 即使 一 个 算法 可 能 复 用 同样 的 数据 , 它 的 数 
据 局 部 性 仍然 可 能 很 差 。 要 使 得 一 次 数据 复 用 能 够 在 高 速 缓存 中 命中 ， 它 就 必须 在 该 数据 被 转 
移出 高 速 缓存 之 前 发 生 。 在 本 例 中 , n 个 乘 - 加 法 把 对 矩阵 了 中 同一 个 元 素 的 复 用 分 开 了 ， 因 
此 数据 局 部 性 变 得 很 差 。 实 际 上 , n 次 运算 把 对 了 中 同一 高 速 缓存 线 内 的 数据 的 复 用 分 开 。 忆 
外 , 在 一 个 多 处 理 器 系统 中 , 只 有 当 数 据 被 同一 个 处 理 器 复 用 时 才 可 能 发 生 高 速 缓存 命中 事件 。 
当 我 们 在 11 2.1 节 中 考虑 一 个 并 行 实现 时 , 我 们 看 到 了 的 元 素 必须 被 每 一 个 处 理 器 使 用 。 因 此 ， 
对 了 的 复 用 并 没有 转化 为 局 部 性 。 

改变 数据 布局 

改善 一 个 程序 的 局 部 性 的 方法 之 一 是 改变 它 的 数据 结构 的 布局 。 比 如 , 把 工 按 列 存放 将 提 
高 对 矩阵 的 高 速 缓存 线 的 复 用 。 这 个 方法 的 应 用 范围 是 有 限 的 ,因为 同一 个 矩阵 通常 会 在 不 
同 的 运算 中 使 用 。 如 果 在 另 一 个 矩阵 乘法 运算 中 了 扮演 了 蕊 的 角色 ,那么 又 会 因为 按 列 存放 而 
损害 效率 ,因为 在 一 个 乘法 运算 中 的 第 一 个 矩阵 按 行 存放 比较 好 。 

分 块 

有 时 可 以 通过 改变 指令 执行 的 顺序 来 改善 数据 局 部 性 。 但 是 循环 互 换 的 技术 并 不 能 提高 矩 
阵 乘法 例 程 的 效率 。 假 设 把 这 个 例 程 改写 成 每 次 生成 矩阵 Z 的 一 列 ， 而 不 是 一 行 。 也 就 是 说 , 把 
j 循 环 变 成 外 层 循环 而 ;循环 变 成 内 层 循环 。 假 设 这 些 和 矩阵 仍旧 按 行 存放 , 矩阵 了 就 有 比较 好 的 





空间 局 部 性 和 时 间 局 部 性 , 但 会 损害 矩阵 了 的 局 部 性 。 y i > 
分 块 (blocking) 是 另 一 种 对 循环 中 的 迭代 重新 排序 的 方 a g 
法 , 它 可 以 大 大 提高 一 个 程序 的 局 部 性 。 我 们 不 再 一 次 计算 结 l iT 





果 和 矩阵 的 一 行 或 者 一 列 , 而 是 按照 图 11-7 中 所 示 把 矩阵 分 割 成 
FM, 或 者 说 块 。 然 后 , 我 们 对 运算 重新 排序 ,使 得 整个 十 
块 只 在 一 小 段 时 间 内 使 用 。 通 常情 况 下 , 这 些 块 是 边 长 为 8 的 
EAR. WEB RR n, 那么 所 有 的 块 都 是 正方 形 。 如 果 B 不 
能 整除 n, 那么 在 矩阵 下 面 或 右面 的 边 上 的 块 的 一 条 或 者 两 条 
边 的 长 度 小 于 B。 

图 11-8 显示 了 基本 和 矩阵 相 乘 算法 的 一 个 版 本 。 在 这 个 版 
本 中 , 全 部 三 个 矩阵 被 划分 为 边 长 为 有 的 正方 形 。 和 图 11-5 图 11-7 ”一 个 被 分 割 成 边 长 为 B 
中 一 样 , 假设 Z 已 经 被 初始 化 为 全 0 和 矩阵。 我们 假设 B ERN, 的 块 的 矩阵 
加 果 不 是 这 样 的 话 , 就 需要 把 第 (4) 行 中 的 上 限 修改 为 min( 苹 + Bin), 并 对 第 5 和 6 行 做 类 似 的 
修改 。 
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1) for (ii = 0; ii < n; ii = ii+B) 
2) for (jj = Of jJ < j= 3578) 
for (kk = 0; kk < n; kk = kk+B) 
for (i = ii; i < ii+B;) 1++) 


for (j= jjs j $ Jiji 5) 
for (k = kk; k < kk+B; k++) 
Zij] = 及 人 ,区 YE 





图 11-8， 基 于 分 块 技术 的 矩阵 乘法 


外 面 的 三 层 循环 , 即 第 1 行 到 第 3 行 , 使 用 下 标 变 量 亏 .和 所。 这 些 变 量 的 增 量 总 是 B, A 
此 它们 总 是 表示 了 某 个 块 的 左面 或 上 面 的 边 。 对 于 固定 的 立 、 广 \、 hk 的 值 , 第 4 行 到 第 7 行 计算 了 
UX a kk] MY Kk, 六 为 左上 角 的 两 个 块 的 乘积 并 加 到 以 Z[ 召 ,j] 为 左上 角 的 块 中 去 。 

当 不 能 够 把 了 X.Y.Z 一 起 放 到 高 速 缓存 中 时 ,如 果 我 们 选择 了 适当 的 B 值 ， 和 基本 算法 相 比 ， 
我 们 可 以 明显 地 降低 高 速 缓存 脱 靶 的 数量 。 选 择 B 使 得 可 以 把 每 个 矩阵 的 各 个 块 一 起 放 到 缓存 
中 去 。 因 为 上 面 的 算法 中 各 个 循环 的 顺序 , 我 们 实际 上 只 需要 把 Z 中 的 每 个 块 放 到 高 速 缓存 中 
一 次 就 可 以 了 。 因 此 ( 像 我 们 在 11.2.1 节 中 对 基本 算法 所 作 的 分 析 那 样 ) 我 们 将 不 需要 计算 因为 
Z 而 产生 的 高 速 缓存 脱 靶 。 

把 下 或 了 的 一 个 块 载 人 到 高 速 缓存 需要 .32《e KARATA, 请 记 住 , c 是 一 个 高 速 缓存 线 
中 的 元 素 的 个 数 。 但 是 , 对 于 确定 的 分 别 来 自 了 和 了 的 块 , 我 们 在 图 11-8 的 第 4 行 到 第 7 行 中 进 
ITT BP 次 乘 -加 法 运算 。 因 为 整个 矩阵 乘法 需要 n 次 乘 -加 法 运算 , 所 以 把 两 个 块 加 载 进 缓存 
的 次 数 是 n3/ B”。 因 为 每 次 加 载 一 个 块 时 会 碰 到 2B?/c 次 高 速 缓存 脱 靶 , 所 以 总 的 缓存 脱 靶 数量 
Æ 2n3/Be, 

把 这 个 数字 2n3/VBc 和 11. 2.1 节 中 给 出 的 估计 值 相 比 是 很 有 意思 的 。 在 那 一 节 中 , 我 们 说 ， 
如 果 整 个 矩阵 可 以 一 起 放 到 高 速 缓存 中 的 话 ， 就 将 出 现 0(n2/c) 次 高 速 绥 存 脱 靶 。 然 而 , 在 那 种 
情况 下 , 我 们 可 以 令 B=n, 即 把 每 个 矩阵 当成 一 个 块 。 我 们 仍然 可 以 得 到 前 面 估算 的 O(n?/c) 
次 高 速 缓存 脱 靶 。 另 一 方面 , 我 们 观察 到 如 果 不 能 把 整个 矩阵 放 到 高 速 缓存 中 , 就 需要 Olne) 
次 高 速 缓存 脱 靶 ,甚至 O(n? ) 次 脱 靶 。 在 这 种 情况 下 , 假设 我 们 可 以 选择 相当 大 的 B 值 (比如 B 
可 以 是 200, 此 时 仍然 可 以 把 三 个 8 字 节 数字 的 块 放 到 一 个 1 MB 的 高 速 缓 存 中 ), 在 矩阵 乘法 中 
使 用 分 块 技术 有 很 大 的 优越 性 。 

分 块 技术 可 以 被 应 用 到 内 存 层次 结构 的 各 个 层次 上 。 上 比如 , 我 们 可 能 希望 通过 把 一 个 2 x2 
和 矩阵 乘法 的 运算 分 量 都 放 到 寄存 器 中 ， OPTE ee Res FSS 对 于 不 同 层 次 的 高 速 缓存 和 物 
HAF, 我 们 使 用 逐渐 增 大 的 分 块 尺寸 。 

类 似 地 , 我 们 可 以 把 各 个 块 分 布 到 不 同 的 处 理 器 上 , 以 便 使 数据 流量 达到 最 小 。 实 验 显示 ， 
这 样 的 优化 在 单 处 理 器 情况 下 的 性 能 加 速 比 可 以 达到 3, 而 在 多 处 理 器 系统 上 的 加 速 比 几乎 和 所 
使 用 的 处 理 器 数量 成 线性 关系 。 








基于 块 的 矩阵 乘法 的 另 一 个 视点 
我 们 可 以 想象 图 11-8 中 的 矩阵 站 、Y、Z 并 不 是 nxn 的 浮 点 数 的 矩阵 ,而 是 (n/B) x (n/ 
B) KERE, 而 这 个 矩阵 的 元 素 本 身 又 是 B x 8 的 泽 点 数 的 矩阵 。 那 么 ,图 11-8 中 的 第 1 行 到 
第 3 行 就 像 是 图 11-5 中 的 基本 算法 的 三 个 循环 ,但 是 它们 处 理 的 矩阵 的 大 小 是 a/B, 而 不 是 n。 
我 们 可 以 把 图 11.8 的 第 4 行 到 第 7 行 看 作 是 图 11-5 中 的 单个 乘 - 加 法 运算 的 实现 。 请 注意 ， 
在 这 个 运算 中 的 单个 乘法 步 又 对 应 于 一 个 矩阵 乘法 步骤 ,使 用 了 图 11-5 中 对 元 素 为 浮 点 数 的 
| 两 个 短 阵 相 有 的 基本 和 法 。 短 隆 如 法 就 是 各 个 元 来 上 的 沧 点 数 加 法 。 
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11.2.3 高 速 缓存 干扰 

遗憾 的 是 , 对 于 高 速 缓存 的 利用 还 有 一 些 问 题 要 解决 。 大 部 分 高 速 缓存 不 是 完全 结合 的 ( 见 
7.4.2 节 )。 在 一 个 直接 映射 的 高 速 缓存 中 ,如果 n 是 高 速 缓存 大 小 的 倍数 , 那么 一 个 ”xz WE 
阵 的 同一 行 中 的 各 个 元 素 将 竞争 同样 的 高 速 缓 存 位 置 。 在 那 种 情况 下 , 把 某 列 的 第 二 个 元 素 加 
载 进 高 速 缓存 将 会 把 第 一 个 元 素 的 高 速 缓存 线 挤 出 高 速 缓存 。 即 使 高 速 缓存 有 能 力 同 时 存放 所 
有 这 些 高 速 缓存 线 , 这 样 的 情况 仍然 会 发 生 。 这 种 情况 被 称 为 高 速 缓 存 干扰 (cache interference) 。 

对 于 这 个 问题 有 多 种 解决 方法 。 第 一 个 方法 是 一 劳 永 逸 地 重新 排列 数据 , 使 得 被 访问 的 
数据 放 在 连续 的 数据 位 置 上 。 第 二 个 方法 是 把 n xn 的 数组 放 在 一 个 较 大 的 mxn 的 数组 中 ， 
我 们 可 以 选择 适当 的 m 来 最 小 化 干扰 问题 。 第 三 种 方法 是 选择 一 个 可 以 保证 避免 干扰 的 分 块 
K". 

11.2.4 11.2 节 的 练习 

练习 11. 2. 1: 和 图 11-5 中 的 代码 不 同 , 图 11-8 中 的 基于 块 的 矩阵 相 乘 算 法 中 不 包含 把 矩阵 
Z 的 所 有 元 素 清 零 的 初始 化 部 分 。 在 图 11-8 中 加 入 把 Z 初始 化 为 全 零 矩阵 的 步骤。 

11.3 和 迭代 空间 

本 节 的 研究 动机 是 充分 利用 11. 2 节 中 提 到 的 优化 技术 。 对 于 一 些 简单 情况 ,比如 矩阵 乘法 ， 
这 些 技术 是 相当 简单 明了 的 。 对 于 更 加 一 般 的 情况 , 同样 的 技术 仍然 可 用 , 但 此 时 它们 的 应 用 就 
远 没有 那么 直观 了 。 然 而 , 通过 应 用 一 些 线性 代数 技术 , 我 们 可 以 使 得 这 些 技 术 能 够 完成 对 一 般 
情况 的 优化 。 

11.1.5 节 中 讨论 过 , 我 们 的 转换 模型 中 有 三 种 空间 : 迭代 空间 、 数 据 空间 和 处 理 器 空间 。 这 
里 我 们 首先 从 迭代 空间 开始 。 一 个 循环 娱 套 结构 的 迭代 空间 被 定义 为 该 嵌 套 结构 中 所 有 循环 下 
标 变 量 取 值 的 组 合 。 

和 图 11-5 中 的 矩阵 乘法 的 例子 一 样 ,迭代 空间 常常 是 矩形 的 。 在 那 种 情况 下 , Re 
的 循环 具有 下 界 0 和 上 界 n -1。 但 是 , 在 更 复杂 但 相当 现实 的 循环 嵌 套 结构 中 , 一 个 循环 下 标的 
上 界 和 下 界 可 能 依赖 于 较 外 层 循环 的 下 标 值 。 我 们 很 快 会 看 到 这 样 的 一 个 例子 。 

11.3.1 从 循环 风 套 结构 中 构建 迭代 空间 

让 我 们 首先 描述 一 下 即将 学 习 的 技术 能 够 处 理 哪些 类 型 的 循环 霸 套 结构 ， 每 个 循环 有 一 个 
唯一 的 循环 下 标 , 我 们 假设 每 次 迭代 这 个 下 标 增加 1。 这 个 假设 并 没有 失去 一 般 性 , 因为 如 果 每 
次 迭代 的 增 量 是 大 于 1 的 整数 c, 那么 总 是 可 以 把 对 下 标 i 的 使 用 蔡 代 为 ci +a, 其 中 a 是 某 个 正 
或 负 的 常数 , 然后 循环 中 的 每 次 迭代 将 i 加 1。 这 个 循环 的 上 下 界 必 须 写 成 其 外 层 循环 的 下 标的 
仿 射 表 达 式 。 

6 11. 5 考虑 下 面 的 循环 


for (i: = 23.i-<= 1003) i=) i+3) 
Z[i] = 0; 
该 循环 的 每 轮 运行 把 循环 下 标 i 加 3, 它 的 效果 是 把 各 个 数组 元 素 Z[2], Z[5], 2Z[8]， 
ZL98] 设置 为 0。 我 们 可 以 使 用 下 面 的 循环 来 得 到 同样 的 效果 : 


for (j = 0; j <= 32; j++) 
Z[3*j+2] = 0; 


也 就 是 说 , BNA 37 +2 BRT i。 下 界 i=2 变 成 了 1=0( 只 需要 求解 方程 3j+2 =2 就 可 得 到 7 的 
值 ), 而 上 界 i<100 ÆR T j<32(K 3j +2<100 简化 可 得 j<32. 67, 又 因为 j 必须 是 整数 , 所 以 要 
舍弃 小 数 部 分 ) 。 ; 回 
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通常 情况 下 , BRAT ER RESP for 循环 结构 。 对 于 一 个 while 循环 或 者 repeat 
循环 , 如 果 存在 一 个 下 标 以 及 该 下 标的 上 下 界 , 那么 它 就 可 以 被 替换 为 一 个 for 循环 图 11-9a 
中 的 循环 就 是 这 样 的 情况 。 一 个 像 for(i =0;i<100;i++) 这 样 的 for 循 环 可 以 达到 同样 的 
目标 。 


i= 0; 
while (1) { 
< 一 些 语 杀 > 


i s= 0 
while (i<100) { 
< 一 些 和 i 无 关 的 语句 > 


i = itl; i = itt; 





Ji } 
a) 一 个 具有 明显 界限 的 While 循环 b) 不 清楚 这 个 循环 在 什么 时 候 或 是 否 会 终止 
i = 0; 


while (i<n) { 
< 一 些 与 1 及 n 无 关 的 语句 > 


i = i+1; 


F 
9) 我 们 不 知道 "的 值 ,因此 我 们 不 知道 这 个 循环 什么 时 候 终止 





图 11-9 一 些 while 循环 


但 是 有 些 while 循环 或 repeat 循环 没有 明显 的 界限 。 比 如 , 图 11-9b 中 的 例子 可 能 会 中 止 , 也 
可 能 不 会 终止 , 但 是 没有 办 法 指出 在 未 知 的 循环 体 中 i 满足 什么 条 件 时 程序 会 跳出 该 循环 。 图 
11-9: 是 另 一 个 会 出 现 问题 的 情况 。 例 如 , 变量 n 可 能 是 一 个 函数 的 参数 。 我 们 知道 循环 迭代 芭 
WK, 但 是 在 编译 时 刻 我 们 不 知道 n 的 值 是 什么 。 实 际 上 , 我 们 可 能 期 望 该 循环 在 不 同 的 执行 中 迭 
代 的 次 数 不 同 。 在 图 11-9b 和 图 11-9e 这 样 的 情况 下 , 我 们 必须 把 i 的 上 界 当 作 无 限 来 处 理 。 

一 个 深度 为 a 的 循环 媒 套 结构 可 以 被 建 模 为 一 个 d 维 空间 。 空 间 的 各 个 维 是 有 序 的 , 第 天 维 

表示 该 仍 套 结构 中 从 最 外 层 循环 起 的 第 下 个 循环 。 这 个 空间 中 的 一 个 点 (xl ,x2,… ,xga) 表示 所 有 

这 些 循环 下 标的 值 , 最 外 层 循环 下 标的 值 是 % ,第 二 个 循环 下 标的 值 是 > ,以 此 类 推 。 最 内 层 循 
环 下 标的 值 是 xu。 

但 并 不 是 这 个 空间 中 的 每 个 点 都 代表 了 一 个 在 该 循环 藤 套 结构 执行 时 实际 出 现 的 下 标 取 
值 组 合 。 作 为 外 层 循环 下 标的 一 个 仿 射 函数 ,每 个 循环 的 上 下 界 都 定义 了 一 个 不 等 式 , 它 把 
空间 分 成 两 半 ， 对 应 于 循环 迭代 的 部 分 ( 即 正 的 半空 间 ) 和 不 对 应 于 迭代 的 部 分 ( 即 负 的 半空 
间 ) 。 所 有 线性 不 等 式 的 交 ( 逻 辑 AND ) 表示 这 些 正 的 半空 间 的 交集 , 该 交集 定义 了 一 个 西 多 
面体 ( convex polyhedron) 。 我 们 把 这 个 多 面体 称 为 这 个 循环 内 套 结构 的 迁 代 空间 (iteration 
space) 。 一 个 凸 多 面体 具有 以 下 性 质 : 如 果 两 个 点 在 该 多 面体 内 , 那么 它们 之 间 的 连 线 上 的 所 
有 点 都 在 该 多 面体 内 。 多 面体 使 用 循环 界限 不 等 式 描述 。 循 环 的 每 个 迭代 都 可 以 由 该 多 面体 
中 的 具有 整数 坐标 的 点 表示 。 反 过 来 ， 人 
mas 人 
考虑 图 11-10 中 的 二 维 循环 谨 套 结构 。 我 们 可 以 使 
用 图 11-11 中 显示 的 二 维 多 面 体 对 这 个 深度 为 2 的 循环 嵌 套 结 | tor G = 0; i < 5; i++) 
构建 模 。 图 中 的 两 个 轴 表示 循环 下 标 i 和 j 的 值 。 下 标 i 可 以 se GE a pe 
取 0 ~5 之 间 的 任何 整数 值 ; 下 标 j 可 以 取 满足 i<j<7 的 任何 
整数 值 。 O 图 11:10 一 个 二 维 循 环 嵌 套 结 构 
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图 11-11 fa 11. 6 的 迭代 空间 





Z 
迭代 空间 和 数组 访问 


在 图 11-10 的 代码 中 , 迭代 空间 也 是 数组 Z 中 被 该 代码 访问 到 的 部 分 。 这 种 类 型 的 访问 
是 很 常见 的 , 它们 的 数组 下 标 就 是 按 某 种 顺序 排列 的 循环 下 标 。 但 是 ， 我 们 不 应 该 把 迭代 空 
间 和 数据 空间 相 混淆 。 和 迭代 空间 的 各 个 维度 是 各 循环 下 标 。 假 设 我 们 在 图 11-10 的 代码 中 使 
用 一 个 类 似 于 Z[2 * i, +f) RAT RR ZLj,i]， 那么 兴 代 空间 和 数据 空间 之 间 的 区 别 
就 很 明显 了 。 


11.3.2 ”循环 嵌 套 结构 的 执行 顺序 

一 个 循环 说 套 结构 的 顺序 执行 按照 上 升 的 词典 顺序 逐个 执行 它 的 迭代 空间 中 的 各 个 迭代 。 
一 个 向 量 i=|io yi ,…,in ERRARE A AAE Eio iind A ii SAM 
当 存 在 一 个 m< minl a,n’) EEL iosi, daala kibir] sie IEA ime Sina MER, m 可 
以 等 于 0, 实际 上 这 种 情况 很 常见 。 
把 i 当 作 外 层 循环 , 例 11. 6 中 的 循环 铅 套 结构 的 迭代 按照 图 11-12 所 示 的 顺序 执行 。 














E 

[0,4], , [0,6], [0,7] 

, (1, 4], 3 [1,6], ERAI 

3 [2,4], 3 [2,6], [2,7] 

[3,4], , 2.6), BA 

[4,4], , [4,6], [4,7] 

[5,5], [5,6], | [5,7] 

图 11-12 图 11-10 中 的 循环 嵌 套 的 迭代 的 执行 顺序 

11.3.3 不等式 组 的 矩阵 表示 方法 
在 一 个 深度 为 d HOVER ERE PIE ART WBC Tr es N 

(i te 24 PIBi+b>0} (11.1) 


其 中 : 
1) Z( 按 照 数学 惯例 ) 表示 整数 的 集合 一 一 包括 正 整数 、 负 整数 和 和 零 。 
2) B 是 一 个 dxd 的 整数 矩阵 。 
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3) b 是 一 个 长 度 为 4 的 整数 向 量 。 
4) 0 是 一 个 由 d 个 零 组 成 的 向 量 。 
DEE 我 们 可 以 把 例 11. 6 中 的 不 等 式 写成 图 11-13 中 的 形式 。 也 就 是 说 , i 的 范围 用 ;>0 和 
i<5 表示 ; j 的 范围 用 j 二 i 和 j<7 表示 。 我 们 要 求 这 0 
些 不 等 式 都 能 写成 地 + 才 +>0 WER. BE, lu, 中 
中 变 成 了 不 等 式 (11. 1) 中 和 矩阵 吾 的 一 行 , w 变 成 向 量 让 |o 
b 中 的 相应 元 素 。 比 如 , i>0 就 是 这 种 形式 , 其 中 心 = | 7 
1, v=0, w=0。 这 个 不 等 式 用 图 11-13 P B HEIT 图 11-13， 矩 阵 向 量 乘法 和 一 个 向 量 的 不 等 
ET CE R FAIA ELTA IR 
看 另 一 个 例子 , 不 等 式 i<5 等 价 于 ( -1)i+(0)j+5 
>0, 它 由 图 11-13 H B Fb 的 第 二 行 表示 。 另 外 , ji 变 成 了 ( -1)i+ (1)j+0>0, 由 第 三 行 表示 。 
最 后 , j<7 变 成 (0)i+ ( -1)7+7>0, 由 图 中 和 矩阵 和 向 量 的 最 后 一 行 表示 。 口 





处 理 不 等 式 

为 了 像 例 11. 8 中 那样 转换 不 等 式 , 我 们 可 以 像 处 理 等 式 一 样 进行 转换 。 比 如 ,在 不 等 
式 两 边 都 增加 或 减少 同样 的 值 ,或 将 两 边 都 乘 以 同样 的 常量 。 我 们 必须 记 住 的 唯一 特殊 规 
则 是 ， 当 我 们 把 不 等 式 两 边 都 乘 以 一 个 负数 的 时 候 , 必须 改变 不 等 号 的 方向 。 因 此 ，i<5 
乘 以 - 1 就 变 成 -i> -5。 给 不 等 式 两 边 都 加 上 5 得 到 -i+5>0, 实际 上 就 是 图 11-13 的 
第 二 行 。 
11.3.4 混合 使 用 符号 常量 

有 时 我 们 需要 对 涉及 某 些 变量 的 循环 嵌 套 结构 进行 优化 , 这 些 变量 对 于 该 戏 套 中 的 所 有 循 
环 都 是 循环 不 变 的 。 我 们 把 这 样 的 变量 称 为 符号 常量 (symbolic constant) , 但 是 为 了 描述 一 个 迭 
代 空间 的 边界 , 我们 需要 把 它们 当 作 变 量 进行 处 理 , 并 在 循环 下 标 变量 组 成 的 向 量 中 为 它们 创建 
一 个 条 目 。 这 个 向 量 就 是 通用 不 等 式 (11. 1) 中 的 向 量 i。 
Gi 11. 考虑 下 面 的 简单 循环 : 


for (i = 0; i <= n; i++) { 








} 
这 个 循环 定义 了 一 个 一 维 的 迭代 空间 ,下 标 变 量 是 i, 界限 是 i=0 和 i<n。 因 为 n 是 一 个 符号 常 
E, 我 们 需要 把 它 当 作 一 个 变量 包括 进来 , 得 到 一 个 循环 下 标的 向 量 [;,m] 。 按 照 矩 阵 - 向 量 的 
形式 ,这 个 和 迭代 空间 被 定义 为 


-1 1 i 0 
fieze |[ lef} 

请 注意 , 虽然 数组 下 标的 向 量具 有 两 个 维度 , 但 它们 中 只 有 表示 i 的 第 一 维 是 输出 部 分 ， 即 
迭代 空间 的 点 集 。 
11.3.5 控制 执行 的 顺序 

从 一 个 循环 体 的 上 下 界 中 抽取 到 的 线性 不 等 式 定义 了 一 个 凸 多 面体 上 的 迭代 的 集合 。 这 个 
表示 方法 并 没有 假定 在 迭代 空间 中 的 迭代 之 间 的 任何 执行 顺序 。 原 程序 在 迭代 之 上 强加 了 二 个 
串 行 顺序 , 该 顺序 就 是 按照 从 外 到 内 方式 排列 的 循环 下 标 变量 取 值 的 词典 排序 。 但 是 , 只 要 遵守 
它们 之 间 的 数据 依赖 关系 ( 即 循环 娱 套 结构 中 不 同 赋值 语句 所 执行 的 对 任 一 数组 元 素 的 写 / 读 操 
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作 的 顺序 没有 改变 ) ; 就 可 以 按照 任何 顺序 执行 该 空间 中 的 选 代 。 

如 何 选择 一 个 既 遵 守 数 据 依赖 关系 ,又 能 优化 数据 局 部 性 和 并 行 性 的 顺序 是 很 困难 的 问题 ， 

我 们 稍 后 将 从 11.7 节 开 始 处 理 这 个 问题 。 这 里 我 们 假设 已 经 有 了 一 个 合法 且 令 人 满意 的 排序 ， 
说 明 如 何 生成 遵守 这 个 顺序 的 代码 。 首 先 让 我 们 讨论 例 11. 6 中 的 另 一 个 排序 。 
在 例 11. 6 的 程序 中 , 迭代 之 间 没 有 数据 依赖 关系 。 因 此 ,可 以 用 串 行 或 者 并 行 的 方 
式 执行 这 些 迭 代 。 因 为 在 此 代码 中 选 代 [; 放 访 问 了 元 素 ZU, il, 原 程序 按照 图 11-14a 中 的 顺序 
访问 数组 。 为 了 提高 空间 局 部 性 , 我 们 更 愿意 像 图 11-14b 所 显示 的 那样 连续 地 访问 数组 中 的 邻 
近 元 素 。 





Z(0,0], Z[1,0], ZI2,0 2[3,0], 2[4,0], 2[5,0), 
Ais 22,1), 285 Ze Z(5, 1], 
2[2,2], Z[3,2], 2[4,2], 2[5,2], 

Z(3, 3], 2[4, 3], 2[5, 3), 

Z(4,4], Z[5,4], 

Z[5, 5), 








a) 原来 的 访问 顺序 


]， 


0, 
0, 
0, 
(0, 
(0, 
[0, 
(0, 
(0, 








0] 
1], 
2 
3 ? 
4 
5 
6], 
7], 








b) 更 好 的 访问 顺序 0) 更 好 的 迭代 顺序 
图 11-14 一 个 循环 嵌 套 结构 的 访问 和 和 代 的 重新 排序 


如 果 我 们 按照 图 11-14c 中 的 顺序 执行 循环 的 迭代 , 就 能 够 得 到 上 面 的 访问 模式 。 也 就 是 说 ， 
我 们 垂直 地 ( 而 不 是 水 平地 ) 扫 描 图 11-11 中 的 迭代 空间 , 因此 j 变 成 了 外 层 循环 的 下 标 。 按 照 上 
面 的 顺序 执行 这 些 迭 代 的 代码 是 


for (j = Ordo Ts j++) 
for (i = 0; i <= min(5,j); i++) 


可 [区 = 0; O 

给 定 一 个 凸 多 面体 和 一 个 下 标 变量 的 排序 , 我 们 该 如 何 生成 循环 的 界限 , 使 得 循环 能 够 按照 
这 些 变量 的 词典 排序 扫描 这 个 迭代 空间 ? 在 上 面 的 例子 中 , AR isj 在 原 程 序 中 是 作为 内 层 循 
环 下 标 广 的 下 界 出 现 的 , 但 是 在 转换 得 到 的 程序 中 它 作为 内 层 循环 下 标 i 的 上 界 出 现 。 

最 外 层 循 环 的 界限 是 用 符号 常量 和 常量 的 线性 组 合 来 表示 的 , 它 定义 了 该 循环 下 标的 全 部 
取 值 的 范围 。 内 层 循环 的 下 标 变 量 的 界限 用 较 外 层 循环 的 下 标 变量 、 符 号 常量 和 常量 的 线性 组 
合 来 表示 。 对 于 给 定 的 较 外 层 循环 下 标 变量 的 每 个 取 值 组 合 ,它们 定义 了 该 循环 下 标 变量 的 取 
值 范围 。 

投影 

从 几何 学 的 角度 来 讲 , 我 们 可 以 把 表示 和 迭代 空间 的 凸 多 面体 投影 (projectiog ) 到 该 空间 中 对 
应 于 较 外 层 循环 的 维度 上 ,以 得 到 一 个 深度 为 2 的 循环 馈 套 结构 中 外 层 循 环 下 标 变量 的 循环 界 
限 。 直 观 地 讲 , 一 个 多 面体 在 一 个 较 低 维度 空间 的 投影 就 是 该 物体 在 这 个 空间 中 的 影子 。 图 
11-11 中 的 二 维 迭 代 空 间 到 ; 轴 上 的 投影 是 从 0 到 5 的 垂直 线 ; 而 到 7 轴 的 投影 是 从 0 到 7 的 水 平 
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线 。 当 我 们 把 一 个 3 维 物体 沿 着 z 轴 投 影 到 二 个 二 维 的 xy 的 平面 上 时 ;我 们 消除 变量 失去 
了 各 个 点 的 高 度 信息 , 而 仅仅 记录 下 该 物体 在 x -y 平 面 上 的 二 维 覆 盖 区 域 。 
循环 界限 生成 只 是 投影 的 多 种 用 途 之 一 。 投 影 的 正式 定义 如 下 。 令 5 为 一 个 n 维 多面 体 。 
S 到 它 的 前 m 个 维度 的 投影 是 满足 如 下 条 件 的 点 (%1 ,x; ,… ,x ): 存在 milom an 使 得 
EL at an ES 中。 我 们 可 以 使 用 Fourier-Motzkin 消除 算法 来 计算 投影 。 下 面 介绍 该 
算法 。 
Fourier-Motzkin 消除 算法 。 
输入 : 一 个 带 有 变量 x, ,xz ,… ,x。 的 多 面体 $。 也 就 是 说 , S 是 关于 变量 * 的 一 组 线性 约束 。 
一 个 给 定 的 变量 en 是 被 指定 需要 消除 的 变量 。 
输出 : 一 个 关于 变量 ,2 zw mat ,20( 即 除 和 之 外 的 所 有 8 的 变量 ) 的 多 面体 $'。 
S 是 5S 到 除 第 m 个 维度 之 外 的 所 有 维度 的 投影 。 
方法 : 令 C 是 5S 中 所 有 涉及 x 的 约束 的 集合 。 执 行 下 列 步 又; 
1) HFC RRF an 的 每 二 对 上 界 和 下 界 ， 比 如 
LSc,x,, 
C2% m SU 
建立 一 个 新 的 约束 
cL<ciU 
请 注意 ,ci 和 cs 是 整数 , 但 二 和 书 可 能 是 关于 除 x, 之 外 的 其 他 变量 的 表达 式 。 
2) ,如果 整数 cl 和 cs AAAF, 将 上 面 约束 的 两 边 都 除 以 这 个 因子 。 
3) 如 果 新 的 约束 是 不 可 满足 的 , 那么 5 无 解 , 即 多 面体 S 和 5' 都 是 空 的 空间 。 
4) 5' 是 约束 集合 S$-C 加 上 在 第 2 步 中 生成 的 所 有 约束 。 
顺便 说 一 下 , 如 果 x, AHA u FRM NER, 消除 x, 最 多 会 产生 w AW ANS Ds 回 
在 算法 11. 11 的 第 一 步 中 引入 的 约束 对 应 于 约束 集合 C 所 列 涵 的 对 系统 中 其 余 变量 的 约束 。 
因此 , 5S' 中 有 一 个 解 的 充 要 条 件 是 5S 中 至 少 有 一 个 对 应 的 解 。 给 定 $' 中 的 一 个 解 ， 把 约束 集合 C 
中 除了 Xm 之 外 的 所 有 变量 蔡 换 为 它们 在 这 个 解 中 的 实际 取 值 , 就 可 以 得 到 x,, 的 取 值 范围 。 
考虑 定义 了 图 11-11 中 的 选 代 空间 的 不 等 式 组 。 假 设 我 们 希望 使 用 Fourier-Motzkin 
消除 算法 来 消除 i 维度, 从 而 把 这 个 二 维 空间 投影 到 ;维度 上 。 存在 一 个 :的 下 界 0 三 ; 和 两 个 上 
界 i<j 和 i<5。 这 可 以 生成 两 个 约束 0<j 和 0<5。 后 一 个 约束 是 永 真 式 , 可 以 忽略 。 前 一 个 约 
束 给 出 了 7 的 下 界 , 7 的 上 界 就 是 原来 的 上 界 7<7。 回 
循环 界限 的 生成 
既然 我 们 已 经 定义 了 Fourier-Motzkin 消除 算法 ， 生成 循环 界限 来 遍历 一 个 凸 多 面体 的 算法 
(算法 11. 13) 就 很 容易 得 到 了 。 我 们 按照 从 最 内 层 到 最 外 层 循环 的 顺序 计算 循环 界限 。 所 有 涉 
及 最 内 层 循环 下 标 变量 的 不 等 式 都 被 改写 成 为 该 变量 的 下 上 界 的 形式 。 然 后 ， 我 们 通过 投影 消 
除 代 表 了 最 内 层 循 环 的 维度 ,得 到 减少 了 一 个 维度 的 多 面 休 。 我 们 重复 这 个 过 程 ， 直 到 找 出 所 有 
循环 下 标 变量 的 界限 。 
给 定 一 组 变量 的 顺序 ,计算 这 些 变量 的 界限 。 
输入 : 一 个 在 变量 v2 ,…, 之 上 的 凸 多 面体 S. 
输出 : 每 个 变量 v AP ALL; 和 上 界 U,, 这 些 界限 只 使 用 排 在 v; 之 前 的 变量 vJ <i) RRA. 
方法 : 该 算法 在 图 11-15 中 描述 。 O 
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Sn = S; /* 使 用 算法 11.11 来 计算 循环 界限 */ 
for (t=n;i>1li-—){ 
Ly; = SH; 的 所 有 下 界 ; 
Uy, = Si F vi 的 所 有 上 界 ; 
Sii = 将 算法 11.11 应 用 于 消除 约束 集合 5; 中 的 vi 后 得 到 
的 约束 集合 ; 


} 
A 消除 宛 余 性 */ 
= 0; 


eth i<gnji++){ 

消除 所 有 由 S! ARRI Ly, 和 Uy, PRISER 

46 Ly, A Uy, 中 其 余 关于 vi 的 约束 加 到 5" 中 。 
} 





图 11-15 ”按照 一 个 给 定 的 变量 顺序 表示 变量 界限 的 代码 


DERU 我 们 应 用 算法 11. 13 来 生成 用 于 垂直 扫描 图 11-11 中 的 迭代 空间 的 循环 界限 。 下 标 
变量 的 顺序 是 j, i。 该 算法 生成 了 如 下 的 界限 : 

L;0 

US 

Li:0 

U;:7 
我 们 要 满足 所 有 这 些 约束 , 因此 i 的 上 界 是 min(5,j) 。 这 个 例子 中 没有 宛 余 的 界限 。 z 
11.3.6 ”坐标 轴 的 变换 

请 注意 , 上面 讨论 的 对 迭代 空间 进行 水 平 扫描 或 垂直 扫描 只 是 两 种 最 常见 的 访问 迭代 空间 

的 方法 。 还 有 很 多 其 他 的 可 行 方法 ,比如 , 我 们 可 以 按照 逐条 斜 线 的 方式 来 扫描 例 11.6 中 的 和 
代 空间 。 下 面 的 例 11. 15 就 讨论 这 种 扫描 方法 。 
我 们 可 以 按照 逐条 针线 的 方式 来 扫描 图 11-11 中 的 送 代 空间 , 使 用 的 顺序 如 图 11-16 
所 示 。 每 条 斜 线 上 的 点 的 坐标 7 和 i 之 间 的 差 值 是 一 个 





常量 。 开 始 的 时 候 这 个 差 值 是 0， 而 结束 的 时 候 是 7。 | Mth pi Ba Ba 
因此 , 我 们 定义 一 个 新 的 变量 k=j 一 i, 并 按照 针对 k,j | oa [13] 24), B3, 
的 词典 顺序 来 扫描 上 面 的 迭代 空间 。 在 不 等 式 中 用 7 到 | | 六 tes eh [el 
SRi, 我 们 得 到 : 

Osj-k <5 

j-k<j <7 


要 为 上 面 描述 的 顺序 建立 循环 界限 , 可 以 对 上 面 的 图 11-16 图 11-11 的 迭代 空间 的 斜 向 排序 
不 等 式 集合 按照 变量 顺序 k、j 应 用 算法 11.13, 得 到 
Lik 
U5 +k,7 
L,,:0 
U,:7 
根据 这 些 不 等 式 , 我 们 可 以 生成 下 列 代码 。 在 访问 数组 的 时 候 , i 被 替换 为 - 
for (k = 0; k <= 7; k++) 


for (j = k; j <= min(5+k,7); j++) 
Z(j,j-k] = 0; 
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一 般 来 说 , 我 们 可 以 通过 创建 新 的 循环 下 标 变量 并 定义 这 些 变量 的 顺序 ， 从 而 改变 一 个 多 面 
体 的 坐标 轴 。 这 些 新 的 循环 下 标 变量 表示 了 原来 变量 的 仿 射 组 合 。 这 个 问题 的 难点 在 于 如 何 选 
择 适 当 的 坐标 轴 ， 使 得 在 满足 数据 依赖 关系 的 同时 达到 并 行 性 和 局 部 性 目标 。 我 们 将 从 11.7 节 
开始 讨论 这 个 问题 。 在 这 里 , 我 们 的 结果 表明 一 旦 选择 好 坐标 轴 , 就 可 以 像 例 11. 15 所 示 那 样 直 
接生 成 想 要 的 代码 。 i 

还 有 很 多 遍历 - 迭代 的 顺序 不 能 使 用 这 个 技术 处 理 。 比 如 , RATT Ts ST] — 
代 空 间 中 的 奇数 行 , 然后 再 访问 其 偶数 行 。 或 者 我 们 可 能 想 从 迭代 空间 的 中 间 开 始 然 后 逐渐 到 
达 边 缘 地 带 。 但 是 , 对 于 具有 仿 射 访问 函数 的 应 用 程序 而 言 , 这 里 描述 的 技术 覆盖 了 人 们 期 望 的 
大 部 分 迭代 排序 。 

11.3.7 11. 3 节 的 练习 

练习 11. 3. 1: 把 下 面 的 循环 转换 成 为 男 一 种 形式 , 其 中 循环 下 标 每 次 增加 1: 

1) for (i=10; 1<50; i=it+7) X[i,i+1] = 0; 

2) for (i= -3; i<=10; i=i+2) X[i] = x[i+1]; 

3) for (i=50; i>=10; i--) X[i] = 0; 

练习 11. 3. 2: TBH BHAT F iy MR Ea 19 IE Ne E : 

1) 图 11-17a 中 的 循环 在 套 结构 。 

2) 图 11-17b 中 的 循环 嵌 套 结构 。 

3) 图 11-17e PAE MRE o 


for (i = 1; i < 30; i++) for (i = 10; i <= 1000; i++) 
for! (j= +23) l< 40-4; 7+) for (j= i; j < i+10;| j++) 





Xii, j] = 0; X[i,j] = 0; 
a) FE] 11.3.20) IG PREAH b) 练习 11.3.2(2) 的 循环 媒 套 结构 





for (i = 0; i < 100; i++) 
for (j = 0; j < 100+i; j++) 


for (k = itj; k < 100-i-j; k++) 
XLi, jkl = 0; 


c) AE>]11.3.23) AGERE 
图 11-17 练习 11.3.2 MHAREAY 





练习 11. 3. 3: 按照 (11.1) 的 形式 写 出 图 11-17 中 的 每 个 循环 妊 套 结构 所 蕴涵 的 约束 。 也 就 
是 给 出 向 量 i 和 ob UKER B KE. 

练习 11.3.4: 颠倒 图 ,11-17 中 的 各 个 藤 套 结构 的 循环 召 套 顺序 。 

练习 11.3.5: 使 用 Fourier-Motzkin 消除 算法 从 练习 11.3.3 中 得 到 的 各 个 约束 集合 中 消除 交 

练习 11.3.6: 使 用 Fourier-Motzkin 消除 算法 从 练习 11.3.3 中 得 到 的 各 个 约束 集合 中 消 
除 j。 

练习 11.3.7: 对 于 图 11-17 中 的 每 个 循环 媒 套 结构 , 改写 相应 的 代码 , 使 得 坐标 轴 i 被 蔡 换 
为 主 对 角 线 ， 即 新 的 坐标 轴 可 以 用 i=j 描述 。 新 的 坐标 轴 应 该 对 应 于 最 外 层 循环 。 

练习 11. 3. 8: 对 于 下 列 的 坐标 轴 变 换 , 重复 练习 11.3.7: 

1) 将 i 替换 为 i+j, 即 新 的 坐标 轴 的 方向 是 i+j 等 于 常量 的 直线 。 新 的 坐标 轴 对 应 于 最 外 层 
的 循环 。 

2) 将 7 替换 为 ;?-217。 新 的 坐标 轴 对 应 于 最 外 层 循环 。 
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1 练习 11.3.9: 在 下 列 循 环 中 , SABA C 为 常 整数 并 且 C>1, B>A: 
for (i = A; i <= B; i = i + C) 
Z[i}..= 0; 
改写 这 个 循环 使 得 该 循环 的 下 标 变量 的 增 量 为 1, 并 且 初 值 为 0。 也 就 是 说 , 新 循环 的 形式 如 下 : 


for (j = 0; j <= D; j++) 
Z[Exj + F] = 0; 


Hp DEF 为 整数 。 把 DEF 表示 为 4、B\C 的 表达 式 。 
练习 11. 3. 10: 对 于 一 个 通用 的 深度 为 2 BIERKE 


for (i = 07 2 <= Ay it+) 
for(j = B*i+C; j <= D*i+E; j++) 


其 中 4 Bl) EE ROR, MER - BSR, E Bi+b=0 HERS He MEME IAC 
空间 的 约束 。 
练习 11. 3. 11: 对 于 如 下 的 带 有 整数 符号 常量 m 和 的 通用 的 深度 为 2 的 循环 嵌 套 结构 


for |(E = 0; 2 <= m;| i++) 
for(j = A*i+B; j <= C#itn; j++) 


重复 练习 11. 3. 10。 和 前 面 一 样 , A.B 和 C 表示 特 定 的 整数 常量 。 只 有 iyami n 可 以 在 未 知 量 
的 向 量 中 出 现 。 另 外 请 记 住 , RA i Aj 是 表达 式 的 输出 变量 。 


11.4 仿 射 的 数组 下 标 


本 章 关注 的 是 仿 射 数组 访问 , 即 每 个 数组 下 标 都 被 表示 为 循环 下 标 和 符号 常量 的 仿 射 表达 
式 。 念 射 函 数 提供 了 从 迭代 空间 到 数据 空间 的 简明 的 映射 关系 , 这 使 得 我 们 容易 确定 哪些 迭代 
被 映射 到 同一 个 数据 或 同一 个 高 速 缓存 线 。 

就 像 一 个 循环 的 仿 射 上 下 界 可 以 表示 成 一 个 矩阵 - 向 量 的 计算 一 样 , 我 们 可 以 使 用 同样 的 
方法 来 处 理 仿 射 访 问 函 数 。 只 要 把 仿 射 访问 函数 表示 成 矩阵 - 向 量 的 形式 , 我 们 就 可 以 应 用 标 
准 的 线性 代数 技术 来 寻找 相关 的 信息 ， 比 如 被 访问 数据 的 维度 以 及 哪些 迭代 指向 同一 个 数据 。 
11. 4. 1 仿 射 访问 

如 果 下 列 条 件 成 立 , 我 们 就 说 一 个 循环 中 的 一 个 数组 访问 是 仿 射 的 。 

1) 该 循环 的 上 下 界 被 表示 为 外 围 循环 变量 和 符号 常量 的 仿 射 表达 式 ， 且 

2) 该 数组 的 每 个 维度 的 下 标 也 是 外 围 循 环 变量 和 符号 常量 的 仿 射 表达 式 。 

OBEMA 假 设 ;和 7 是 循环 下 标 变量 ,其 上 下 界 通过 仿 射 表达 式 给 出 。 仿 射 数组 访问 的 例子 
# Zi], Z[i+j+1], Z[0], Z[i,i]MZ[2*i+1,3 *j-10], WR n E-NR E PH 
符号 常量 , 那么 Z[3 * n,n -让 是 仿 射 数 组 访问 的 另 一 个 例子 。 但 是 Z[i* 站 和 2Z[n* 放 不 是 仿 射 
访问 。 IE 

每 个 仿 射 数组 访问 可 以 用 两 个 矩阵 和 两 个 向 量 来 描述 。 第 一 个 矩阵 - 向 量 对 是 BB 和 4b, 它们 
以 式 (11.1) 中 的 不 等 式 的 方式 描述 了 该 访问 的 迭代 空间 。 我 们 通常 用 F 和 J SR ea RLE 
阵 -向 量 对 。 它们 表示 循环 下 标 变量 的 函数 , 这 些 函 数 生 成 了 在 数组 访问 的 不 同 维度 中 使 用 的 数 
组 下 标 。 

正式 地 说 , 我 们 把 使 用 了 下 标 变 量 向 量 守 的 一 个 循环 嵌 套 结构 中 的 数组 访问 表示 为 一 个 四 元 
组 .多 = <F,f,B,b>; 它 把 界限 

Bi+b=0 
中 的 向 量 i 映射 到 数组 元 素 位 置 
Fi +f 
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DEEI (ROU eee Ue ee eo PAE F 和 7 组 成 了 























向 量 i。 另 外 , XY AZ 分 别 是 维度 为 1.2 和 3 的 数组 。 pal 
s AAA Xli- 1 x2 的 矩阵 丸和 | 数组 访问 仿 射 表达 式 | 

一 个 长 度 为 1 MEL 2m. WEE, SRM |, ci ofietan 

阵 -向 量 乘法 并 加 到 了 中 时 , 我 们 得 到 一 个 函数 i 一 1。 j 

这 个 函数 就 是 前 面 提 到 的 对 一 维 数组 X 进行 访问 所 使 Sore ean 

用 的 公式 。 同 时 请 注意 , 第 三 个 访问 Y[j,j+1] 在 进行 ”| Y[i,j] Ld F 

失 阵 -向量 乘法 和 加 法 之 后 , 得 到 一 个 函数 对 (j,j + 

1) 。 它 们 就 是 这 个 二 维 数组 访问 的 下 标 。 E R 
BE, 我们 观察 第 四 个 数组 访问 Y[1,2] 。 这 个 访 | TE lA 








问 是 一 个 常量 , ZRN, EE FP SEE. Ak, 
循环 下 标的 向 量 i 没有 出 现在 访问 函数 中 。 Ele ia Pe | fd] olg 
11.4.2 ”实践 中 的 仿 射 访问 和 非 仿 射 访问 

在 数值 计算 程序 中 , 有 一 些 常见 的 数据 访问 模式 W OT EAT ea 
不 是 仿 射 的 。 涉 及 稀疏 矩阵 的 程序 是 一 个 重要 的 例子 。 eaae [|| 
稀疏 矩阵 的 常用 表示 方法 之 一 是 只 保存 一 个 向 量 中 的 ; 
非 零 元 素 , 并 使 用 辅助 的 下 标 数组 来 记录 某 一 行 从 哪 
里 开始 ; 以 及 哪些 列 包 含 非 零 元 素 。 访 问 这 样 的 数据 “图 11-18 一 些 数组 访问 和 它们 的 
时 要 使 用 间接 数组 访问 。 这 种 类 型 的 访问 ， 比 如 矩阵 -向量 表示 
X[Y[i] ] ,是 对 数组 天 的 非 仿 射 访问 。 如 果 和 矩阵 的 稀 朴 情况 是 有 规律 的 ， 比 如 在 一 个 带 状 矩 阵 中 
只 有 在 对 角 线 周围 才 有 非 零 元 素 , 那么 可 以 使 用 紧密 数组 来 表示 带 有 非 零 元 素 的 子 区 域 。 在 这 
样 的 情况 下 , 数组 访问 仍 可 能 是 仿 射 的 。 | 

另 一 个 常见 的 非 仿 射 访问 的 例子 是 线性 化 的 数组 。 程 序 员 有 时 使 用 一 个 线性 数组 来 存放 一 
个 在 逻辑 上 多 维 的 对 象 。 这 么 做 的 原因 之 一 是 多 维 数组 的 维度 可 能 在 编译 时 刻 未 知 。 在 正常 情 
况 下 写成 Zi 门 形式 的 访问 现在 变 成 了 ZEi*n+j], 其 下 标 是 一 个 二 次 函数 。 如 果 对 线性 化 数 
组 的 每 个 访问 都 可 以 被 分 解 为 不 同 维度 的 分 量 并 保证 每 个 分 量 都 不 会 超过 维度 界限 ,那么 我 们 
可 以 把 这 个 线性 访问 转换 成 为 一 个 多 维 的 访问 。 最 后 , 如 例 11. 18 所 示 , 我 们 注意 到 可 以 使 用 归 
纳 变量 分 析 把 二 些 非 仿 射 访问 转换 成 为 仿 射 访问 。 
我 们 可 以 把 下 面 的 代码 


J 三 03 

for (i = 0; i <= n; itt) { 
Z[j] = 0; 
T eas 





= 





写成 

J en 

for (i = 0; i <= n; i++) { 

Z[n+2*i] = 0; 

} 
这 样 做 使 得 这 个 对 和 矩阵 Z 的 访问 变 成 仿 射 的 。 同 
11.4.3 11.4 节 的 练习 

练习 11. 4. 1: 对 于 下 面 的 每 个 数组 访问 ,给 出 描述 它们 的 向 量 了 和 和 矩阵 三。 假设 下 标 向 量 i 
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Bij, +, 并 且 所 有 的 循环 下 标 都 有 仿 射 的 界限 。 
1) X[2*i+3,2%j-i] 
2) Y[i-j, j-k, k-i] 
3) Z[3, 2 +j, k-2*i+1] 


11.5 数据 复 用 


从 数组 访问 函数 中 我 们 得 到 了 两 种 可 用 于 局 部 性 优化 和 并 行 化 的 有 用 信息 : 

1) 数据 复 用 : 对 于 局 部 性 优化 , 我 们 希望 识别 出 访问 相同 数据 或 相同 高 速 缓存 线 的 迭代 
集合 。 

2) 数据 依赖 : 为 了 并 行 化 和 局 部 性 循环 转换 的 正确 性 , 我 们 希望 找 出 代码 中 的 所 有 数据 依 
赖 关系 。 回 顾 一 下 , 如 果 两 个 (不 一 定 不 同 的 ) 访 问 的 实例 可 能 指向 相同 的 内 存 位 置 , 并 且 其 中 
至 少 有 一 个 是 写 运 算 , 那么 这 两 个 访问 之 间 具 有 数据 依赖 关系 。 

在 很 多 情况 下 , 只 要 我 们 找到 了 复 用 相同 数据 的 迭代 ,就 知道 它们 之 间 必 然 存在 数据 依赖 
关系 。 

只 要 存在 数据 依赖 关系 , 显然 就 会 有 相同 的 数据 被 复 用 。 比 如 , 在 矩阵 乘法 中 , 输出 数组 中 
的 同一 个 元 素 被 写 0(n) 次 。 这 些 写 运 算 必须 按照 原来 的 顺序 执行 ©, 我 们 可 以 分 配 一 个 寄存 器 ， 
令 它 在 计算 输出 数组 的 一 个 元 素 时 存放 该 元 素 。 这 个 就 可 以 利用 这 个 数据 复 用 机 会 。 

不 过 , 并 不 是 所 有 的 数据 复 用 都 可 以 用 到 局 部 性 优化 中 , 下面 的 例子 说 明了 这 个 问题 。 


考虑 下 面 的 循环 : 


for G = 0s <n ae) 
Z(7*i+3] = Z[3+i+5]; 


我 们 观察 到 这 个 循环 在 每 次 迭代 时 都 对 不 同 的 内 存 位 置 进行 写 运算 , 因此 在 不 同 的 写 操作 
之 间 没 有 复 用 或 者 依赖 关系 。 但 是 , 这 个 循环 从 位 置 5、8、11、14、17、… 读 取 数 据 , 而 向 位 置 3、 
10、17、.24… 写 和 人 数据。 不同 迭代 的 读 运 算 和 写 运算 访问 了 共同 的 元 素 17、38 和 59…。 也 就 是 说 ， 
对 于 j=0,1,2,…, 形 如 17+217(j=0,1,2,…) 的 整数 就 是 所 有 既 可 以 写作 7ii+3, 又 可 以 写作 
3i, +5 的 整数 , XE i i) 是 两 个 整数 。 但 是 这 种 复 用 很 少 发 生 , 因此 即使 有 可 能 利用 这 种 复 用 ， 
也 不 容易 做 到 。 E 

数据 依赖 和 复 用 分 析 的 不 同 之 处 在 于 : 具有 数据 依赖 关系 的 访问 中 必须 有 一 个 访问 是 写 访 
问 。 更 重要 的 是 ,数据 依赖 关系 必须 既 正确 又 精确 。 为 了 保持 正确 性 ,， 它 必须 找到 所 有 的 依赖 关 
系 。 但 是 ， 它 又 不 应 该 找 出 假 的 依赖 关系 ,因为 这 些 假 依赖 关系 会 引起 不 必要 的 串 行 执行 

考虑 数据 复 用 时 ,我 们 只 需要 找 出 大 部 分 可 利用 的 复 用 在 哪里 。 这 个 问题 就 简单 多 了 ， 因此 我 
们 在 本 节 中 就 讨论 这 个 主题 , 接 下 来 再 讨论 数据 依赖 问题 。 因 为 循环 界限 很 少 改 变 复 用 区 域 的 形 
AR, 所 以 可 以 通过 忽视 循环 界限 来 简化 对 复 用 的 分 析 。 可 以 被 仿 射 分 划 利用 的 很 多 数据 复 用 位 于 相 
同 数组 访问 的 不 同 实例 之 间 , 以 及 使 用 相同 的 系数 矩阵 ( 即 在 仿 射 下 标 函 数 中 通常 被 称 为 F 的 矩 
阵 ) 的 访问 之 间 。 上 面 介绍 过 , 像 7i+3 和 3i+5 这 样 的 访问 模式 没有 令 人 感 兴趣 的 复 用 。 
11.5.1 数据 复 用 的 类 型 

我 们 首先 用 例 11. 20 来 说 明 不 同 种 类 的 数据 复 用 。 在 下 面 的 内 容 中 , 我 们 需要 区 分 作为 程序 





日 ”这 里 有 一 个 微妙 之 处 。 根 据 加 法 的 交换 率 , 不 管 我 们 按照 什么 顺序 执行 加 法 , 我 们 依然 得 到 相同 的 结果 。 但 是 ， 
这 种 情况 是 很 特别 的 。 一 般 来 说 , 让 编译 器 来 决定 在 一 个 写 运算 之 前 的 一 系列 算术 运算 步骤 完成 哪些 计算 过 于 复 
杂 。 我 们 也 不 能 依赖 于 会 有 任何 代数 规则 来 帮助 我 们 安全 地 重新 排列 这 些 步 又。 
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中 的 一 个 指令 的 访问 (比如 x=2[i,j]) 和 我 们 执行 循环 媒 套 结构 时 指令 的 多 次 执行 。 为 了 强调 
它们 之 间 的 区 别 , 我 们 将 把 访问 指令 本 身 称 为 静态 访问 (static access) ,而 当 我 们 执行 该 循环 典 套 
结构 时 该 语句 的 多 次 和 迭代 称 为 动态 访问 (dynamic access) o 

数据 复 用 可 以 分 为 自 复 用 和 组 复 用 两 种 。 如 果 复 用 同样 数据 的 多 个 迭代 源 于 同一 个 静态 访 
间 , 我 们 就 把 这 样 的 复 用 称 为 自 复 用 ; 如 果 它们 源 于 不 同 的 静态 访问 , 那么 我 们 称 这 个 复 用 为 组 
复 用 。 如 果 一 个 复 用 指向 完全 相同 的 位 置 那么 它 就 是 时 间 复 用 ; 如 果 指向 同一 个 高 速 缓存 线 ， 
那么 它 就 是 空间 复 用 。 
考虑 下 面 的 循环 嵌 套 结构 : 


float Zii; 
for (i = 0; i < n; i++) 
for (j = 0; j < 2; jtt) 
ZUj+1] 三 7A iat + Z(j+2]) /3; 


数组 访问 ZU] .Z[j+1] 和 Z[j+2] 都 具有 自 空间 复 用 性 , PD Fel EARE HE 
的 数组 元 素 。 我 们 假定 连续 元 素 很 可 能 存放 在 同一 个 高 速 缓存 线 中 。 另 外 ,这 些 访问 都 具有 目 
时 间 复 用 性 , 因为 在 外 层 循环 的 每 次 迭代 中 ,同一 个 元 素 被 多 次 使 用 。 再 者 ， 它 们 都 具有 同样 的 
系数 抢 阵 ,因此 具有 组 复 用 性 。 在 不 同 的 访问 之 间 具有 组 复 用 性 ,而且 既 是 时 间 性 复 用 ,又 是 空 
间 性 复 用 。 当 这 些 复 用 都 可 以 利用 时 ， 虽 然 在 代码 中 有 4n? 次 访问 , 我们 只 需要 把 大 约 we 个 高 
速 缓存 线 加 载 到 高 速 缓存 中 即 可 , 其 中 c 是 一 个 高 速 缓存 线 中 的 内 存 字 的 数量 。 因 为 具有 自 空间 
复 用 性 , 我 们 从 4n? 中 消除 了 一 个 因子 n; 因为 存在 空间 局 部 性 ， 我 们 又 把 加 载 次 数 降低 了 c 售 ; 
最 后 因为 组 复 用 的 原因 又 降低 了 4 倍 。 Oo 

下 面 我 们 说 明 如 何 使 用 线性 代数 从 仿 射 数组 访问 中 抽取 复 用 信息 。 我 们 感 兴趣 的 不 仅仅 是 
找 出 有 多 大 的 提高 性 能 的 潜力 ,而 且 要 找 出 哪些 迭代 在 复 用 数据 ， 以 便 把 这 些 选 代 移 近 从 而 利用 
这 些 复 用 。 
11.5.2 BSR 

通过 利用 自 复 用 可 以 有 效 节约 在 内 存 访问 方面 的 开销 。 如 果 一 个 静态 访问 所 指向 的 数据 具 
有 天 个 维度 , 且 这 个 访问 柑 套 在 一 个 深度 为 4(d >) 的 循环 结构 中 , 那么 同一 个 数据 可 以 被 复 用 
ra-k 次 。 其 中 , n 是 每 个 循环 的 迭代 次 数 。 比 如 , 如 果 一 个 深度 为 3 的 循环 嵌 套 结构 访问 一 个 数 
组 的 某 -一 列 ; 那么 访问 节约 系数 就 可 能 达到 忆 。 实 际 上 , 一 个 访问 的 维度 和 这 个 访问 的 系数 矩阵 
的 秩 相 对 应 。 我 们 可 以 通过 寻找 该 矩阵 的 零 空间 来 找 出 哪些 迭代 指向 同一 个 位 置 。 具 体 方法 在 
下 面 解释 。 

和 矩阵 的 秩 

矩阵 巨 的 秩 是 瑟 的 线性 无 关 列 (或 者 等 价 地 , 行 ) 的 最 大 数目 。 一 个 向 量 集合 被 称 为 线性 无 
关 (lineaty independent) 的 条 件 是 没有 向 量 可 以 被 写成 该 集合 中 有 限 多 个 其 他 向 量 的 线性 组 合 。 
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请 注意 , 第 二 行 是 第 一 和 第 三 行 的 和 , 而 第 四 行 是 第 三 行 减 去 第 一 行 的 两 倍 。 但 是 , 第 一 行 
和 第 三 行 是 线性 独立 的 ; 其 中 的 任何 一 行 都 不 是 另 一 行 的 倍数 。 因 此 , 矩阵 的 秩 是 2。 
我 们 也 可 以 通过 检查 各 列 来 得 到 这 个 结果 。 第 三 列 是 第 二 列 的 两 倍 减 去 第 一 列 。 男 一 方面 ， 
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任何 两 列 都 是 线性 独立 的 。 我 们 同样 可 以 确定 矩阵 的 秩 为 2。 口 
DEEA 我 们 看 一 下 图 11-18 中 的 数组 访问 。 第 一 个 访问 X[i - 1] 的 维度 为 1, 因为 矩阵 
[1 0] 的 秩 为 1。 也 就 是 说 , 唯一 的 一 行 是 线性 独立 的 , 同样 第 一 列 也 是 线性 独立 的 。 
第 二 个 访问 Y[i,j] 的 维度 为 2。 原 因 是 和 矩 阵 
THO 
oi 
具有 两 个 独立 的 行 ( 当然, 因此 也 具有 两 个 独立 的 列 )。 
第 三 个 访问 Y[j,j+1] 的 维度 为 1, 因为 矩阵 
QO J 
oi 
的 秩 为 1。 请 注意 , 矩阵 中 的 两 行 是 相同 的 , 因此 只 有 一 行 是 线性 独立 的 。 等 价 地 , 第 一 列 是 第 
二 列 乘 以 0, 因此 这 两 列 不 是 独立 的 。 直 观 地 讲 , 在 一 个 大 的 正方 形 数组 Y 中, 所 有 被 访问 的 元 
素 都 排列 在 紧 靠 主 对 角 线 之 上 的 一 条 斜 线 上 。 
第 四 个 访问 Y[1;2] 的 维度 为 0, 因为 一 个 全 零 矩 阵 的 秩 为 0。 请 注意 ,对 于 这 样 的 二 个 矩 
阵 , 我 们 找 不 出 非 零 的 矩阵 的 行 (哪怕 只 有 一 行 ) 的 线性 和 。 最 后 一 个 访问 Z[i,i,2 +7) 
为 2。 请 注意 在 这 个 访问 的 矩阵 
0 "0 
Lf 
Papas 


中 , 最 后 两 行 是 线性 独立 的 , 任何 一 行 都 不 是 另 一 行 的 倍数 。 但 是 ， 7 ATS eae 
“Al”, 其 中 的 系数 都 是 0。 Oo 

矩阵 的 零 空 间 

在 一 个 深度 为 d 的 循环 嵌 套 结构 中 的 秩 为 > 的 数据 引用 在 Ont) MERRITT O(n") PH 
据 元 素 , 因此 平均 一 定 有 O (nT) 不 迭代 指向 同一 个 数组 元 素 。 哪 些 迭 代 访问 了 同一 个 数据 呢 ? 
假设 在 这 个 循环 嵌 套 结构 中 的 一 个 访问 用 已 和 j 的 矩阵 -向 量 组 合 来 表示 。 令 i 和 为 指向 同一 
个 数组 元 素 的 两 个 迭代 , 那么 Fi+f=Fi'+f。 重 新 排列 这 个 等 式 中 的 各 项 , 我们 得 到 

F(i-i')=0 

有 一 个 众所周知 的 线性 代数 概念 可 以 刻 划 和 说 在 什么 时 候 满足 上 述 等 式 。 满 足 等 式 Fy =0 的 
所 有 解 的 集合 称 为 F 的 零 空间 。 因 此 ,如果 两 个 迭代 的 循环 下 标 向 量 的 差 属 于 和 矩阵 的 零 空间 ， 
那么 它们 指向 同一 个 数组 元 素 。 

显然 , Silty =0 总 是 满足 Fv =0。 也 就 是 说 , 如 果 两 个 向 量 的 差 为 0, 那么 它们 一 定 指向 同 
一 个 数组 元 素 。 换 句 话说， 如果 它们 实际 上 是 同一 个 和 迭代， 它们 就 指向 同一 个 元 素 。 另 外 , 零 空间 
确实 是 一 个 向 量 空 间 。 也 就 是 说 ,如 果 Fv, =0 H Fv, =0, IBA F(v, +v,) =0 A F(cv,) =0。 

WAR AG F 2 24K 44 (fully ranked), 也 就 是 说 它 的 秩 为 d, 那么 FF 的 零 空间 只 包含 零 向 量 。 
在 这 种 情况 下 , 一 个 循环 媒 套 的 各 个 迭代 指向 不 同 的 数据 。 一 般 来 说 , 零 空间 的 维度 , 或 者 说 零 
数 (nullity), MÆ d-ro WR d>r, 那么 对 于 每 个 元 素 , 访问 该 元 素 的 迭代 组 成 一 个 (d -7) 维 
空间 。 

零 空 间 可 以 用 它 的 基本 向 量 表示 。 一 个 天 维 的 零 空 间 可 以 由 天 个 独立 的 向 量 表示 , 任何 可 以 
被 表示 为 这 些 基 本 向 量 的 线性 组 合 的 向 量 都 属于 这 个 空间 。 
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EW 11.21 F, 我 们 确定 这 个 矩阵 的 秩 为 2, 因此 其 零 数 为 3 -2 =1。 在 这 个 例子 中 , 零 空间 的 基 
本 向 量 必然 是 一 个 长 度 为 3 的 非 零 向 量 。 为 了 找到 这 个 零 空间 的 基本 向 量 , 我 们 假设 零 空 间 中 的 
一 个 向 量 为 [x,y,z], 并 尝试 求解 下 面 的 方程 








重新 考虑 例 11. 21 的 矩阵 
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如 果 我 们 将 前 面 两 行 乘 以 未 知 向 量 , 就 得 到 两 个 方程 
x+2y+3z = 0 
5x+7y+9z = 0 


我 们 也 可 以 根据 第 三 和 第 四 行 写 出 这 样 的 方程 ,但 是 因为 不 存在 三 个 线性 独立 的 行 , 所 以 增 
加 方程 不 会 对 xy 和 z 增 加 新 的 约束 。 比 如 , 我 们 从 第 三 行 得 到 的 方程 4x+5y+ 6z = 0 就 是 通过 
从 第 二 个 方程 中 减 去 第 一 个 方程 得 到 的 。 

我 们 必须 尽 可 能 地 从 上 面 的 等 式 中 消除 变量 。 首 先 使 用 第 一 个 方程 求解 *, 得 到 % = -2y - 
3z。 然 后 在 第 二 个 方程 中 替换 x, 得 到 -3y =6z, 即 y= -2z。 由 x= -2y-3z H y= -2z 可 知 x= 
z。 因 此 ,变量 [x,y,z] 实 际 上 是 [z, -2z,z]。 我 们 可 以 选择 任意 的 非 零 : 值 , 得 到 这 个 零 空间 的 
唯一 基本 向 量 。 比 如 , 我 们 可 以 选择 z=1 并 把 [1, -2,1] 当 作 这 个 零 空间 的 基本 向 量 。 m 
例 11. 17 中 的 所 有 数组 访问 的 秩 、 零 数 和 零 空间 显示 在 图 11-19 中 , 请 注意 , 在 所 有 
情况 下 秩 和 零 数 的 和 都 等 于 该 循环 嵌 套 的 深度 2。 因为 数组 访问 Y[i,j] 和 2Z[15i;2 *i+ 门 的 秩 都 
是 2, 因此 所 有 的 迭代 都 指向 不 同 的 位 置 。 
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数组 访问 X[i=1] 和 Y[j,j+1] 的 矩阵 的 秩 都 是 1， 因此 O(n) PERKA. ER 
一 种 情况 下 ,迭代 空间 的 一 整 行 都 指向 同一 个 位 置 。 换 句 话 说 , 仅仅 j 值 不 同 的 所 有 迭代 指向 同 
一 个 位 置 。 这 一 事实 由 相应 零 空间 的 基本 向 量 [0,1] 明确 表 示 。 对 于 了 [7,j+I]， 迭代 空间 中 的 
整 列 指向 同一 个 位 置 。 这 个 事实 由 相应 零 空间 的 基本 向 量 [1,0] 明 确 表示 。 

最 后 ; 数组 访问 Y[1,2] 在 所 有 迭代 中 指向 同一 个 位 置 。 相 应 的 零 空间 有 两 个 基本 向 量 [0， 
1] 和 [1,0] , 这 表示 这 个 循环 嵌 套 中 的 任何 一 对 先 代 都 准确 地 指向 同一 个 位 置 。 口 
11.5.3 ” 自 空间 复 用 

空间 复 用 的 分 析 依赖 于 矩阵 的 数据 布局 。C 语言 的 矩阵 是 按 行 存放 的 ， 而 Fortran 语言 的 抵 
阵 按 列 存放 。 换 句 话说 , 在 C 语言 中 数组 元 素 X[i,j 和 X[i,j+1] 相 邻 , 而 在 Fortran 语言 中 
XLi jl 和 X[i++1, 四 相 邻 。 不 失 一 般 性 , 在 本 章 余下 的 部 分 ; 我 们 将 选用 C 语言 的 数组 布局 方式 
( 按 行 存放 方式 ) 。 

首先 作出 如 下 的 近似 , 当 且 仅 当 两 个 数组 元 素 位 于 一 个 二 维 数组 的 同一 行 中 时 ,我 们 认为 它 
们 共享 一 个 高 速 缓存 线 。 更 加 一 般 地 讲 , 在 一 个 d 维 数组 中 , 如果 两 个 元 素 只 在 最 后 一 维 的 下 标 
值 上 有 所 不 同 , 我 们 就 认为 它们 共享 一 个 高 速 缓存 线 。 因 为 对 于 通常 的 数组 和 高 速 缓存 线 ， 多 个 
数组 元 素 可 以 被 放 到 同一 高 速 缓存 线 中 ,以 整 行 的 方式 顺序 访问 一 个 数组 可 以 明显 提高 访问 速 
度 。 虽 然 严 格 地 讲 ， 我们 有 时 还 需要 等 待 加 载 一 个 新 的 高 速 缓存 线 。 

发 现 和 利用 自 空间 复 用 的 技巧 是 不 考虑 系数 矩阵 F 中 的 最 后 一 行 。 如 果 得 到 的 截 短 后 的 矩 
阵 的 秩 小 于 循环 雹 套 结构 的 深度 , 那么 我 们 就 可 以 确保 最 内 层 循环 只 改变 数组 的 最 后 下 标的 值 ， 
从 而 保证 空间 局 部 性 。 

HEEJ 考虑 图 11-19 中 的 最 后 一 个 数组 访问 Z[1;i,2 *i+ 门 。 如 果 我 们 删除 最 后 一 行 , 就 
会 得 到 下 面 的 截 短 后 的 矩阵 

070 

[io 


这 个 矩阵 的 秩 显然 是 1。 因为 该 循环 霸 套 结构 的 深度 为 2, 所 以 存在 空间 复 用 的 机 会 。 在 这 
个 例子 中 ; 因为 /是 内 层 循环 的 下 标 且 2 是 按 行 存放 的 , 所 以 内 层 循环 访问 Z 的 连续 元 素 。 让 i 
成 为 内 层 循环 的 下 标 不 会 产生 空间 局 部 性 。 因 为 当 i 改 变 时 , 第 二 和 第 三 个 维度 都 会 改变 。 O 
确定 是 否 存在 自 空间 复 用 的 一 般 规则 如 下 。 如 我 们 一 直 所 做 的 ,假设 各 循环 的 下 标 和 系数 
矩阵 的 各 列 顺序 对 应 ,其 中 最 外 层 循环 对 应 于 第 一 列 , 最 内 层 循环 对 应 于 最 后 一 列 。 然 后 , 为 了 
确保 存在 空间 复 用 , 向 量 [0,0,…,0,1] 必 须 在 被 截 短 的 矩阵 的 零 空间 中 。 理 由 是 如 果 这 个 向 量 
在 零 空间 中 , 那么 当 我 们 把 除了 最 内 层 下 标 之 外 的 所 有 下 标 都 固定 下 来 的 时 候 , 就 知道 在 最 内 层 
循环 的 一 次 执行 中 所 有 的 动态 访问 都 只 在 最 后 的 数组 下 标 上 取 不 同 的 值 。 如 果 数组 是 按 行 存放 
的 ,那么 这 些 元 素 之 间距 离 接近 , 有 可 能 在 同一 高 速 缓存 线 中 。 
PRR 请 注意 ,[0,1]( 转 置 为 一 个 列 向 量 ) 位 于 例 11. 25 中 的 被 截 短 矩阵 的 零 空间 中 。 因 
此 , 我 们 期 望 当 把 j 当 作 内 层 循环 下 标 时 会 出 现 空间 局 部 性 。 另 一 方面 , 如 果 我 们 颠倒 循环 的 顺 
序 使 得 ;成 为 内 层 循环 , 那么 系数 矩阵 就 变 成 


f 0 
Ost 
现在 , (0,1) 就 不 在 这 个 矩阵 的 零 空间 中 了 。 相 反 地 ， 零 空间 由 基本 向 量 [1,0] 生 成 。 因 此 ; 如 


我 们 在 例 11. 25 中 所 建议 的 ,如果 ;是 内 层 循环 ,我们 不 再 期 望 这 个 循环 具有 空间 局 部 性 。 
但 是 , 我 们 应 该 观察 到 向 量 [0,0,… ,0,1] 在 零 空间 里 远 不 足以 保证 空间 局 部 性 。 比 如 , 假设 
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该 访问 不 是 Z[1,i,2 si +f) TE Z[1,i,2 #1 +50 *j), MALAI — 一 次 运行 中 , Z 的 每 50 
个 元 素 只 有 一 个 元 素 会 被 访问 ， 除非 一 个 高 速 缓 存 线 长 到 足以 保存 50 个 以 上 的 元 素 ， 否则 我 们 
将 无 法 复 用 一 个 高 速 缓存 线 。 E 
11.5.4 组 复 用 

我 们 只 在 同 二 个 循环 中 的 具有 相同 系数 矩阵 的 数组 访问 之 间 计 算 组 复 用 。 给 定 两 个 动态 访 
间 Fi, +f, 和 Fin + 所 ,它们 复 用 相同 的 数据 的 条 件 是 

Fi, +fi=Fi, +f2 
或 者 说 
F(i, -i,) = ( 万 -iD 

假设 » 是 这 个 等 式 的 一 个 解 ， 如 果 w 是 五 的 零 空 间 中 的 任意 向 量 ， 那么 wi+v 也 是 一 个 解 。 实 际 
E, 这 样 的 向 量 就 是 该 方程 的 全 部 解 。 
下 面 的 深度 为 2 的 循环 嵌 套 结构 

for (i =)1; i < nj it+) 


for (j. = An j <n; 3+) 
Zt 3) = Zh 


有 两 个 数组 访问 Z[i,j] 和 2Z[i 一 1,j]。 请 注意 , RITA ABT MEH Be 

1 0 

0 | 
来 刻 划 。 这 个 矩阵 和 图 11-19 中 的 第 二 个 访问 VC ij] ROKER I 2, 因此 没有 
自 时 间 复 用 。 ' 

但 是 , 每 个 访问 都 展示 了 自 空间 复 用 。 如 11. 5.3 节 中 所 述 ， 当 我 们 删除 该 矩阵 的 最 下 面 一 
行 后 , 只 留 下 最 上 面 的 一 行 [1,0], 其 秩 为 1。 因 为 [0,1] 位 于 这 个 被 截 短 和 矩阵 的 零 空 间 中 ,所 以 
我 们 期 望 找到 空间 复 用 。 内 层 循环 下 标 j 的 每 次 增加 都 会 把 第 二 个 下 标的 值 增加 1, 实际 上 确实 
访问 了 连续 的 数组 元 素 , 并 将 充分 利用 每 个 高 速 缓存 线 。 

虽然 两 个 访问 都 没 有 自 时 间 复 用 性 , 请 注意 这 两 个 访问 Z[i, 站 和 2[i-1, 站 所 访问 的 几乎 是 
同一 个 集合 的 数组 元 素 。 也 就 是 说 , 除了 i=1 的 情况 之 外 ,数组 访问 Z[i-1,j] 所 读 取 的 数据 和 
数组 访问 Z[i, 站 所 写 人 的 数据 相同 , 因此 它们 之 间 存 在 组 时 间 复 用 。 这 个 简单 的 访问 模式 对 于 
整个 迭代 空间 都 成 立 ,， 可 以 利用 这 个 模式 来 提高 代码 的 数据 局 部 性 。 正 式 地 讲 ， 如 果 不 考虑 循环 


界限 , 那么 只 要 
ig -1 
aul E ME P em i | 0 
成 立 , 分别 位 于 迭代 (5 meee 万) 中 的 两 个 数组 访问 Zli lA Z[i-1,7) 48 Te 
置 。 改 写 这 些 项 , 我 们 得 到 
ij =i 
eb: a Ne l 
也 就 是 说 ,hn =j Hi =i +1. 
请 注意 , 这 个 复 用 是 沿 着 迭代 空间 的 i 轴 发 生 的 。 也 就 是 说 , 迭代 (i; ,js ) 在 迭代 (i ji) ZÆ 
之 后 的 元 次 (内 层 循 环 的 ) 迭代 之 后 才 发 生 。 因 此 , 在 被 写 人 数据 被 复 用 之 前 要 执行 很 多 个 迭代 。 
此 时 这 个 数据 有 可 能 在 (也 有 可 能 不 在 ) 高 速 缓 存 中 了 。 如 果 高 速 缓存 中 存放 了 和 矩阵 2 的 连续 两 


行 , 那么 数组 访问 Z[i -1,j] 不 会 发 生 高 速 缓存 脱 划 现象 , 整个 循环 典 套 结构 的 总 的 高 速 缓存 脱 
HBA n/c, 其 中 < 是 每 个 高 速 缓存 线 中 的 元 素数 量 。 否则, 脱 靶 次 数 将 会 为 原来 的 两 倍 ， 因 
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为 这 两 个 静态 访问 对 于 每 。 个 动态 访问 都 要 求 加 载 一 个 新 的 高 速 缓存 线 。 口 
6 11. 假设 在 一 个 深度 为 3 的 循环 说 套 结构 中 有 两 个 访问 4[i,j,i+j] ee es +j] 
该 巾 套 结构 的 下 标 从 外 到 内 分 别 是 ij、k。 那 么 对 于 两 个 访问 = Ci ky |My = linn, ky], 


只 要 
1 0 ofi 0 1 0 ofi 1 
[o 1 | 让 1 of |] 
£1 209, Ad | Hod A Ou 0 
成 立 , 它们 就 能 复 用 同一 个 数组 元 素 。 


这 个 方程 成 立时 ， 向 量 = [i -iji jk k SRA v=[1, -1,0]。 也 就 是 说 
ij =i, +1, ji =j -1 E k = kz © 然而 ， 和 矩阵 


I O00 
ralo 1 | 
E 1.70 


的 零 空 间 是 由 基本 向 量 [0,0,1] 生 成 的 。 也 就 是 说 , BSE Pe k WEE RA. A, E 
面 方 程 的 解 » 可 以 是 [1, -1,m]，, 其 中 m 为 任意 值 。 换 句 话 说 , 在 一 个 下 标 为 i 六 k HERRE 
结构 中 , 4[i,j,i + 让 的 一 个 动态 访问 不 仅 被 4[i,j,i+ 门 的 具有 同样 i\j 值 和 不 同人 值 的 其 他 动态 
访问 所 复 用 , 也 被 A[i+1,j -1,i+ 站 的 其 循环 下 标 值 为 i+1\j-1 和 任意 如 值 的 动态 访问 所 
复 用 。 四 

我 们 可 以 用 类 似 的 方法 来 考虑 组 空间 复 用 , 虽然 不 会 在 这 里 这 么 做 。 和 针对 自 空间 复 用 的 
讨论 一 样 ,我 们 只 需要 舍弃 被 考虑 矩阵 的 最 后 一 维 就 可 以 了 。 

对 于 不 同 种 类 的 复 用 , 复 用 的 程度 是 不 同 的 。 自 时 间 复 用 的 好 处 最 多 : 一 个 具有 处 维 零 空 间 
的 数组 访问 对 同一 个 数据 会 复 用 0(n*) 次 。 自 空间 复 用 的 程度 受到 高 速 缓 存 线 长 度 的 限制 。 最 
后 , 组 复 用 的 程度 受 一 个 组 中 共享 该 复 用 的 数组 访问 数目 的 限制 。 
11.5.5 11.5 节 的 练习 

练习 11. 5. 1: 计算 图 11-20 中 各 个 矩阵 的 秩 。 并 给 出 每 个 矩阵 的 最 大 线性 独立 列 的 集合 , 以 
及 最 大 的 线性 独立 行 的 集合 。 

















ES a E Qu 1 
练习 11.5.2: 找 出 图 11-20 中 各 个 矩阵 的 零 |i 。 6 BB TB patir 
TA aere i, l 
练习 11.5.3: 假设 一 个 迭代 空间 的 维度 ( 变 a) b) o) 
量 ) 为 ij 和 k。 对 于 下 面 的 每 个 访问 ,描述 指向 下 
列 数 组 元 素 的 子 空间 : 图 11-220 计算 这 些 和 矩阵 的 秩 和 零 空 间 


1 ALi ja ey] 
2) Ali,i+1,i42] 
13) Ali,ijj +k] 





O 在 这 里 可 以 观察 到 一 件 很 有 意思 的 事情 。 虽 然 这 个 例子 有 一 个 解 , 但 如 果 我 们 把 第 三 个 分 量 i+j 改 成 i+j+1, 解 
就 不 存在 了 。 也 就 是 说 , 在 这 个 给 定 的 例子 中 , 两 个 访问 所 触及 的 数组 元 素 都 存在 于 一 个 二 维 的 子 空间 5 中。 该 
空间 可 以 定义 为 “第 三 个 分 量 是 前 面 两 个 分 量 的 和 ”。 如 果 我 们 把 i+j 改 成 i+j+1, 则 第 二 个 访问 所 触及 的 元 素 
都 不 在 $ 中 , 因此 也 不 存在 任何 复 用 。 
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! 4) Ali -j j-kk 3i] 
| 练习 11. 5.4: 假设 数组 4 按 行 存放 ， 并 在 下 面 的 循环 嵌 套 结构 中 被 访问 : 
for (i = 0; i < 100; i++) 
for (jf ="05 lj < 100s j++) 
for (k = 0; k < 100; k++) 
< 某 个 对 A 的 访问 > 


对 于 下 列 的 各 个 访问 ; 指出 是 否 可 能 改写 该 循环 结构 , 使 得 对 A 的 访问 具有 自 空间 复 用 特 
性 。 也 就 是 说 , 整个 高 速 缓存 线 被 连续 使 用 。 如 果 可 以 ， 指明 如 何 改 写 这 个 循环 。 注 意 , 对 循环 
的 改写 可 以 包括 对 下 标 变量 重新 排序 或 引入 新 的 循环 下 标 。 但 是 不 能 改变 数组 的 布局 ,比如 把 
数组 改 成 按 列 存放 的 。 还 要 注意 的 是 , 一 般 来 说 ， 循环 下 标的 重新 排序 可 能 是 合法 的 , 也 可 能 是 
非法 的 。 我 们 将 在 下 一 节 给 出 判断 重新 排序 是 否 合法 的 标准 。 但 是 在 这 个 例子 中 , 因为 每 个 访 
问 的 效果 就 是 把 一 个 数组 元 素 设置 为 0， 所 以 不 需要 担心 循环 重新 排列 的 效果 会 影响 程序 的 
语义 3 

1) Afi +1,i+k, j] = 0 

MZV A Pr) = 0 

3) Ali, j,k, +j +k) = 0 

HEA) Al4,3-k,i+3,i+k] = 0 

练习 11. 5. 5; 在 11. 5.3 节 中 ,我 们 说 如 果 最 内 层 循环 只 改变 一 个 数组 访问 的 最 后 一 个 下 标 
值 , 我 们 就 能 获得 空间 局 部 性 。 但 是 这 个 断言 依赖 于 : 数组 是 按 行 存放 的 假设 。 如 果 数 组 是 按 列 
存放 的 , 那么 什么 样 的 条 件 可 以 保证 空间 局 部 性 ? 

| 练习 11. 5. 6: 在 例 11.28 F, 我 们 看 到 两 个 相似 的 数组 访问 之 间 是 否 存 在 复 用 很 大 程度 
上 依赖 于 特定 的 数组 下 标 表达 式 。 将 在 例 11. 28 中 观察 到 的 事实 进行 推广 , 并 决定 对 什么 样 的 函 
AJG, j), 访问 A[i,j,i+j] 和 A[i+1,j-1,f(i,7) | 之 间 存 在 复 用 。 

1 练习 1t.5.7: 在 例 11.27 P, 我 们 指出 ,如果 矩 阵 忆 的 行 的 长 度 很 长 ,以 至 于 不 能 一 起 存 
放 到 高 速 缓存 中 ;就 会 产生 更 多 的 不 必要 的 高 速 缓存 脱 靶 。 如 果 出 现 了 这 样 的 情况 ， 应 怎样 改写 
循环 嵌 套 以 保证 组 空间 复 用 ? 


11.6 数组 数据 依赖 关系 分 析 


并 行 化 或 局 部 性 优化 经 常 对 原 程序 中 执行 的 运算 重新 排序 。 和 所 有 的 优化 一 样 ， 只 有 当 对 
运算 的 重新 排序 不 会 改变 程序 输出 时 才 可 以 对 这 些 运 算 重新 排序 。 一 般 来 说 , 我 们 不 可 能 深入 
理解 一 个 程序 到 底 做 了 什么 ,代码 优化 通常 选用 一 个 较 简单 的 .保守 的 测试 方法 来 决定 在 什么 时 
候 可 以 肯定 程序 的 输出 不 会 受到 优化 的 影响 : 检查 在 原 程序 中 和 在 修改 后 的 程序 中 , 对 同一 内 存 
位 置 的 各 个 运算 被 执行 的 顺序 是 否 一 样 。 在 当前 的 研究 中 , 我 们 关注 的 是 数组 访问 , 因此 数组 元 
素 就 是 需要 考虑 的 内 存 位 置 。 

如 果 两 个 访问 (不 管 是 读 还 是 写 ) 指向 两 个 不 同 的 位 置 , 显然 它们 是 相互 独立 的 (可 以 被 重 
新 排序 ) 。 另 外 , 读 运 算 不 会 改变 内 存 的 状态 , 因此 各 个 读 运算 之 间 是 独立 的 。 根 据 11.5 节 的 介 
绍 ,如 果 两 个 访问 指向 同一 个 内 存 位 置 并 且 其 中 至 少 有 一 个 写 运算 , 那么 就 说 这 两 个 访问 是 数据 
依赖 的 。 为 了 保证 修改 后 的 程序 和 原 程序 做 同样 的 事情 , 每 一 对 有 数据 依赖 关系 的 运算 在 原 程 
序 中 的 执行 顺序 必须 在 新 的 程序 中 得 到 保持 。 

回顾 一 下 10. 2. 1 节 , 可 知 存 在 三 种 类 型 的 数据 依赖 : 

1) 真 依赖 , 一 个 写 运算 后 面 跟 一 个 对 同一 个 内 存 位 置 的 读 运 算 。 

2) 反 依赖 , 一 个 读 运算 后 面 跟 一 个 对 同一 个 内 存 位 置 的 写 运算 。 
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3) 输出 依赖 , 是 两 个 针对 同一 个 位 置 的 写 运 算 。 

在 上 面 的 讨论 中 , 数据 依赖 是 针对 动态 访问 定义 的 。 只 要 一 个 程序 的 某 个 静态 访问 的 某 个 
动态 实例 依赖 于 另 一 个 静态 访问 的 某 个 动态 实例 ， 我 们 就 说 第 一 个 静态 访问 依赖 于 第 二 个 静态 
vill? . 

我 们 可 以 很 容易 看 出 数据 依赖 关系 如 何 应 用 到 并 行 化 中 。 比如, 如 果 在 一 个 循环 的 各 个 访 
问 之 间 没 有 发 现 数据 依赖 关系 , 那么 就 可 以 很 容易 地 把 不 同 的 迭代 分 配给 不 同 的 处 理 右 。11.7 
节 将 讨论 如 何 系统 化 地 将 这 个 信息 应 用 到 并 行 化 中 。 

11.6.1 数组 访问 的 数据 依赖 关系 的 定义 

让 我 们 考虑 对 同一 个 数组 的 两 个 静态 访问 , 它们 可 能 位 于 不 同 的 循环 中 。 第 一 个 访问 用 访 
间 函 数 和 界限 表示 为 .2= <F,f,B,b>, 它 位 于 一 个 深度 为 d 的 循环 媒 套 结构 中 ; 第 二 个 访问 表 
ANF = <F',f,B',b' >, 它 位 于 一 个 深度 为 d' 的 程序 嵌 套 结构 中 。 如 果 下 面 的 条 件 成 立 , 这 
两 个 访问 就 是 数据 依赖 的 。 

1) 它们 中 至 少 有 一 个 是 写 运算 , 且 

2) 存在 24 中 的 向 量 i 和 2 中 的 向 量 让 使 得 

Q Bi+b=0 

© B'i'+b20 

@ Fit+f = F'i' +f’ 

因为 一 个 静态 访问 通常 会 产生 多 个 动态 访问 ,所 以 考虑 它 的 多 个 动态 访问 是 否 可 能 指向 同 
一 个 内 存 位 置 也 是 有 意义 的 。 为 了 寻找 同一 个 静态 访问 的 不 同 实例 之 间 的 依赖 关系 , 我 们 假设 
F=F' 并 在 上 面 的 定义 中 加 太 附 加 条 件 i i IRRF ILE o 


考虑 下 面 的 深度 为 1 的 循环 嵌 套 结构 : 


for (i = t; a < 10; itt) { 
Zia = Zits 
} 


这 个 循环 具有 两 个 数组 访问 : Z[i-1] 和 2[i]。 第 一 个 访问 是 读 运算 , 而 第 二 个 访问 是 写 运算 。 
为 了 找到 这 个 程序 中 的 所 有 数据 依赖 关系 , 我 们 需要 检查 这 个 写 运算 和 它 自 身 以 及 上 面 的 读 运 
算 之 间 是 否 具 有 依赖 关系 : 
1) ZLi-1] fe Zi] ZAM HKERMA AR. RT B—-TER, 每 个 迭代 都 会 读 取 前 一 个 迭代 
写 入 的 值 。 从 数学 的 角度 看 , 因为 存在 整数 i 和 使 得 
1&i<10, 1<710, Bi=1=7 
所 以 我 们 知道 它们 之 间 存 在 一 个 依赖 关系 。 上 面 的 约束 系统 有 九 个 解 : (i=2,i =1), (i= 
3,i'=2), 等 等 。 
2) 2Z[ 让 和 它 自身 之 间 的 依赖 关系 。 可 以 看 到 ,这 个 循环 的 不 同 迭 代 向 不 同 的 位 置 写 人 数 
据 。 也 就 是 说 , 写 访问 Z[ 引 的 各 个 实例 之 间 不 存在 数据 依赖 关系 。 从 数学 的 角度 看 , 因为 不 存在 
整数 和 ?7 满足 条 件 
Laisi TEA 
因此 我 们 知道 实例 之 间 不 存在 依赖 关系 。 请 注意 ,之 所 以 有 第 三 个 条 件 =i BAA BR 
Zli] MZ i] 必须 在 同一 个 位 置 上 。 和 这 个 条 件 矛 盾 的 第 四 个 条 件 i 是 因为 要 求 依赖 关系 必 





O 回忆 一 下 静态 访问 和 动态 访问 之 间 的 区 别 。 一 个 静态 访问 是 程序 中 某 个 位 置 上 的 数组 引用 ， 而 一 个 动态 访问 是 这 
个 引用 的 一 次 执行 。 
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须 是 非 平 凡 的 一 “必须 是 不 同 动态 访问 之 间 的 依赖 关系 。 

任意 两 个 读 访问 总 是 独立 的 , 因此 不 需要 考虑 上 面 的 读 引用 Z[i-1] 和 它 自身 之 间 的 依赖 
关系 。 口 
11. 6.2 整数 线性 规划 

对 数据 依赖 关系 的 分 析 要 求 找 出 是 否 存在 一 些 整数 满足 由 等 式 和 不 等 式 组 成 的 约束 系统 。 
其 中 的 等 式 是 从 数组 访问 的 矩 阵 -向 量 表 示 中 得 到 的 ; 不 等 式 是 从 循环 界限 中 得 到 的 。 等 式 可 
以 用 不 等 式 表示 : 等 式 x =y 可 以 用 两 个 不 等 式 % 宇 y A yea 表示 。 

因此 , 数据 依赖 关系 问题 可 以 被 表示 为 寻找 满足 一 组 线性 不 等 式 的 整数 解 ,这 个 问题 就 是 众 
所 周知 的 整数 线性 规划 (integer linear programming) 。 整 数 线性 规划 是 一 个 NP 完全 问题 。 虽 然 没 
有 已 知 的 多 项 式 复杂 性 的 算法 , 但 人 们 研发 了 多 种 启发 式 解 法 来 解决 涉及 很 多 变量 的 线性 规划 
问题 。 这些 解 法 在 很 多 情况 下 运行 得 是 相当 快 的。 遗憾 的 是 , 这 样 的 标准 启发 式 解 法 并 不 适合 
数据 依赖 关系 分 析 。 在 数据 依赖 分 析 中 , 问题 的 难点 在 于 如 何 解决 很 多 小 且 简单 的 整数 线性 规 
划 ， 而 不 是 大 型 的 复杂 整数 线性 规划 。 

数据 依赖 关系 分 析 算 法 由 三 个 部 分 组 成 : 

1) 使 用 丢 番 图 方程 的 理论 , 应 用 GCD( Greatest Common Divisor, 最 大 公约 数 ) 测 试 来 检验 是 
否 存 在 满足 问题 中 所 有 等 式 的 整数 解 。 如 果 没 有 整数 解 ,那么 就 不 存在 数据 依赖 关系 , 否则 就 用 
等 式 来 蔡 换 其 中 的 某 些 变量 ,从 而 得 到 较 简单 的 不 等 式 组 。 

2) 使 用 一 组 简单 的 启发 规则 来 处 理 大 量 的 典型 不 等 式 。 

3) 在 少数 情况 下 , 这 些 启发 式 规则 可 能 还 解决 不 了 问题 。 此 时 , 我 们 使 用 线性 整数 规划 求 
解 程序 来 解决 问题 。 这 个 程序 基于 Fourier-Motzkin 消除 算法 , 使 用 了 一 种 分 支 并 设 限 的 方法 来 
求解 。 

11.6.3 GCD 测试 

第 一 个 子 程序 检验 是 否 存在 满足 约束 中 各 个 等 式 的 整数 解 。 只 考虑 整数 解 的 方程 称 为 丢 盔 
图 方程 (Diophantine equation) 。 下 面 的 例子 说 明了 只 考虑 整数 解 会 带 来 什么 问题 ; 同时 它 也 说 
H, 虽然 很 多 例子 中 每 次 只 涉及 单个 循环 媒 套 结构 , 数据 依赖 关系 的 公式 表达 还 可 以 被 应 用 到 位 
于 不 同 循环 中 的 数组 访问 。 
考虑 下 面 的 代码 片段 : 


for (i = i; i < i0; i++) { 
PA EE a E aes 





} 
fo tG = 15 4 3s Lo d 
Z[2*j+1] = ...; 


Hila) Z[2 i] RAAE Z 的 偶数 号 元 素 , 而 访问 2[2 *j+1] 只 触及 奇数 号 元 素 。 显 然 , 如 果 省 略 号 
表示 的 右 部 不 涉及 2 的 运算 , 那么 不 管 循环 的 界限 如 何 , 这 两 个 访问 之 间 没 有 数据 依赖 关系 。 我 
们 可 以 在 第 一 个 循环 执行 之 前 就 执行 第 二 个 循环 , 或 者 交 又 执行 这 两 个 循环 的 迭代 。 这 个 例子 
看 起 来 是 人 为 设计 的 、 没有 实际 意义 , 其 实 不 然 。 数 组 的 偶数 号 元 素 与 奇数 号 元 素 被 分 开 处 理 的 
一 个 实际 例子 是 复数 数组 , 其 中 各 个 复数 的 实 部 和 虚 部 各 占 一 个 元 素 , 并 列 存放 。 

为 了 证 明 这 个 例子 中 没有 数据 依赖 关系 , 我 们 做 如 下 论证 。 假 设 存 在 整数 ;和 7 使 得 Z[2 * 
让 和 2[2*J+l] 是 同一 个 数组 元 素 , 我 们 得 到 丢 番 图 方程 

Bi OA dd 
没有 整数 i 和 j 可 以 满足 上 面 的 方程 。 证 明 如 下 : 如 果 i 是 一 个 整数 , 那么 2i 就 是 偶数 。 如 
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果 j 是 一 个 整数 , BBA 2j A, Alle 27 +1 是 奇数 。 没有 哪个 偶数 同时 也 是 奇数 。 因 此 ， 这 个 

方程 没有 整数 解 , 因此 这 两 个 写 访问 之 间 没 有 依赖 关系 。 回 
为 了 描述 一 个 线性 丢 番 图 方程 什么 时 候 有 人 解 ,我 们 需要 引 和 人 两 个 或 多 个 整数 的 最 大 公约 数 

的 概念 。 多 个 整数 oj , ap, …, an KI CCD, 记 为 gcd(a1 ,a2,…,an), 是 能 够 整除 这 些 整 数 的 最 大 

整数 。GCD 可 以 使 用 著名 的 欧 几 里 德 算法 ( 见 下 面 的 “ 欧 几 里 德 算法 部分) 快速 地 计算 。 

ocd(24,36,54) = 6, 因为 24/6、36/6 和 54/6 的 余数 都 是 0, 而 且 用 任何 大 于 6 的 整 

数 去 除 24.36 .54 时, 至少 有 一 个 余数 非 零 。 比 如 , 12 能够 整除 24 和 36, 但 是 不 能 整除 54。 O 
GCD 的 重要 性 体现 在 下 面 的 定理 中 。 


线性 丢 番 图 方程 


CI1X1 + az% ahd 十 anXn =c 


有 x1 sy 5 san 的 一 个 整数 解 ， 当 且 仅 当 ged( ol ,oa ,… ,a ) 能 够 整除 c。 o 
在 例 11. 30 中 , 我 们 看 到 线性 丢 番 图 方程 2i=2j +1 无 解 。 我 们 可 以 把 这 个 方程 写作 
ope 


现在 gcd(2, -2) =2 且 2 不 能 整除 1。 因 此 方程 无 解 。 
再 看 另 一 个 例子 , 考虑 方程 
24x +36y +54z = 30 


因为 ged(24,36,54) =6 H 30/6 =5, 因此 存在 x、y 和 = 的 整数 解 。 其 中 的 一 个 解 是 x= -1, y =0 
且 z=1, 但 是 存在 无 穷 多 个 其 他 的 解 。 口 

数据 依赖 关系 问题 的 第 一 步 是 使 用 一 个 诸如 高 斯 消除 算法 的 标准 方法 来 求解 给 定 的 方程 组 。 
每 构造 出 一 个 线性 方程 , 就 应 用 定理 11. 32 尽 可 能 地 排除 整数 解 的 存在 。 如 果 我 们 能 够 排除 这 样 
的 整数 解 , 那么 答案 就 是 “ 否 ”"。 否 则 我 们 使 用 这 些 方程 的 解 来 减少 不 等 式 中 的 变量 数目 。 


考虑 两 个 方程 


X=2y+z=0 

3x+2y +z = 5 
从 各 个 方程 本 身 来 看 是 存在 解 的 。 对 于 第 一 个 方程 ,gcd(1, -2,1) =1 能 够 整除 0, 而 对 于 第 二 
， 个 方程 , gcd(3,2,1) =1 能 够 整除 5。 但 是 , 如 果 我 们 求解 第 一 个 方程 得 到 z=2y -x, 并 以 此 替代 
第 二 个 方程 中 的 z, 我 们 得 到 2x +4y =5。 因 为 ged(2,4) =2 不 能 整除 5, 所 以 这 个 丢 番 图 方程 无 
解 。 回 





欧 几 里 德 算法 

欧 几 里 德 算法 按照 下 面 的 方法 找 出 gcd(a,5) 的 值 。 首 先 , 假设 a Ab 为 正 整数 , HaSd, 
请 注意 ,多 个 负数 的 GCD ,或 一 个 负数 与 一 个 正 数 的 CCD 等 于 它们 的 绝对 值 的 GCD, 因此 可 
以 假设 所 有 的 整数 都 是 正 的 。 

WR a=b, 那么 gcd(a,b) =a, WRarb, Sc Ha/b 的 余数 。 如 果 c=0, 那么 5 整除 a， 
因此 ged(a,b) =b, ill, 计算 ged(b,c) 得 到 的 结果 也 是 gcd(a,6)。 

为 了 计算 n>2 时 的 gcd(ai,a2,… ,Qn) ,使 用 欧 几 里 德 算 法 来 计算 gcd(a; ,az ) =c, 然 后 递 
归 地 计算 gcd(c,aa ,aq4 ，……,an)。 
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11.6.4 解决 整数 线性 规划 的 启发 式 规则 

数据 依赖 关系 问题 需要 求解 很 多 简单 的 整数 线性 规划 问题 。 现 在 我 们 讨论 处 理 简单 不 等 式 
组 的 几 个 技术 ,以 及 一 个 可 以 利用 在 数据 依赖 关系 分 析 时 发 现 的 相似 性 的 技术 。 

独立 变量 测试 

从 数据 依赖 关系 分 析 中 得 到 的 很 多 整数 线性 规划 问题 由 多 个 只 涉及 一 个 未 知 量 的 不 等 式 组 
成 。 这 类 规划 问题 的 解法 很 简单 ,只 需要 分 别 测试 常量 上 界 和 常量 下 界 之 间 是 否 存在 整数 即 可 。 


:考虑 棋 套 循环 结构 
for (i = 0; i <= 10; i++) 
for (j = 0; j <= 10; j++) 
Zli, jl] = 20j+20, 4410); 
为 了 找 出 Z[i,j] 和 2Z[j+10,i+11] 之 间 是 否 存 在 数据 依赖 关系 , 我 们 考虑 是 否 存在 整数 i, j, 六 和 
了 ,使 得 
0<i,j,i',j’<10 
i=j’ +10 
jai tll 
对 其 中 的 方程 应 用 GCD 测试 可 以 确定 可 能 存在 一 个 整数 解 。 这 些 方程 的 整数 解 可 表示 
如 下 : 
i = tJa t= ell gt, — 10 
其 中 , ti Alt, ETER. JOR, My 代入 上 面 的 线性 不 等 式 ,我 们 得 到 


0 三 ty <10 


© 


ty <10 


O © 


< 
< ll 10 
=, 1,,10,. =10 
这 样 , 把 根据 后 两 个 不 等 式 得 到 的 下 界 与 根据 前 两 个 不 等 式 得 到 的 上 界 组 合 起 来 , 我 们 推出 
10<¢, <10 
11< t,<10 

因为 如 的 下 界 大 于 它 的 上 界 , 因此 不 存在 整数 解 , 也 就 没有 数据 依赖 关系 。 这 个 例子 说 明 ， 
即使 存在 涉及 多 个 变量 的 等 式 , CCD 测试 (原文 如 此 , 实际 应 该 是 独立 变量 测试 , 译 者 注 ) 依 然 可 
以 构造 出 每 个 不 等 式 只 涉及 一 个 变量 的 线性 不 等 式 组 。 E 

无 环 测试 

另 一 个 简单 的 启发 式 规则 是 寻找 是 否 存在 一 个 其 上 界 或 下 界 为 常量 的 变量 。 在 某 些 情况 下 ， 
我 们 可 以 安全 地 用 这 个 常量 来 蔡 换 这 个 变量 。 简 化 后 的 不 等 式 组 有 一 个 整数 解 当 且 仅 当 原来 的 
不 等 式 组 有 一 个 整数 解 。 明 确 地 说 , 假设 v; 的 每 个 下 界 都 具有 如 下 形式 ; 

对 于 某 个 ce; >0, co Sat; 
同时 vw; 的 上 界 都 具有 如 下 形式 : 
CS CoM CY ke tC Up + Or Ul te toad, 

其 中 , c; 是 非 负 整 数 。 那 么 我 们 可 以 把 变量 v; 蔡 换 为 最 小 的 可 能 整数 值 。 如 果 没 有 这 样 的 下 界 ， 
我 们 可 以 把 w 替换 为 - %w AIH, 如 果 涉 及 vi 的 所 有 约束 都 可 以 表示 成 上 面 的 两 种 形式 , 但 
是 不 等 号 的 方向 相反 , 那么 我 们 可 以 把 变量 vi; 替换 为 最 大 的 可 能 整数 值 , 或 者 在 没有 常量 上 界 时 
替换 为 。 可 以 重复 这 个 步骤 对 不 等 式 不 断 化 简 , 在 某 些 情况 下 可 以 确定 不 等 式 无 解 。 
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Gi) 11. 考虑 下 面 的 不 等 式 : 


Is v, n <10 


v <v, +4 
变量 vi 的 下 界 由 v 确定 , 而 上 界 由 v3 +4 确定 。 但 是 ， 界定 n 下 界 的 只 有 常量 1, AE v LF 
的 只 有 常量 4。 因 此 , 在 这 些 不 等 式 中 把 v 替换 为 1 并 把 v 蔡 换 为 4， 我 们 得 到 


1 三 vi <10 


1 < vi 
vi < 8 
现在 这 个 不 等 式 组 可 以 很 容易 地 使 用 独立 变量 测试 的 方法 求解 。 O 


循环 残 数 测试 

现在 让 我 们 考虑 每 个 变量 的 上 下 界 都 由 其 他 变量 确定 的 情况 。 在 数据 依赖 分 析 中 经 常会 碰 
到 形 如 ww Sv, te 的 约束 。 这 种 情况 可 以 使 用 Shostak 提出 的 循环 残 数 测试 (loop-residue test ) 的 一 
个 简化 版 本 来 求解 。 这 样 的 一 组 约束 可 以 用 一 个 有 向 图 表示 。 这 个 图 的 结 点 标号 为 不 等 式 中 的 
ER, TENAR oci te, 都 有 一 条 从 结 点 到 o 的 标号 为 “的 对 应 边 。 

我 们 把 二 条 路 径 的 权重 ( weight) 定 义 为 该 路 径 上 所 有 边 的 标号 的 和 。 图 中 的 每 条 路 径 表示 此 
纹 束 系统 中 的 一 组 约束 的 组 合 。 也 就 是 说 , 只 要 存在 一 条 从 v 到 v' 的 权重 为 c 的 边 , 我 们 就 可 以 
推断 出 yy 和 w+ cs 图 中 的 一 条 权重 为 的 环 表示 对 环 中 的 每 个 结 点 都 存在 约束 v<v+c。 如 果 
我 们 能 够 在 图 中 找到 一 个 权重 为 负 的 环 , 那么 就 可 以 推断 出 ”< v， 而 这 是 不 可 能 成 立 的 。 此 时 ， 
我 们 断定 不 等 式 组 无 解 , 因此 也 就 没有 依赖 关系 。 

我 们 也 可 以 把 形 如 c<v 或 <c 的 约束 放 到 循环 残 数 测试 中 去 , 这 里 ?2 是 一 个 变量 , c 是 一 个 
常量 。 我 们 向 不 等 式 系统 引入 一 个 新 的 哑 变 量 v0。 这 个 哑 变 量 被 加 到 每 个 常量 上 界 和 常量 下 界 
上 。 当 然 的 值 一 定 是 0, 但 是 因为 循环 残 数 测试 只 寻找 图 中 的 环 ， 变量 的 实际 值 并 不 重要 。 为 
了 处 理 常 量 上 下 界 , 我 们 把 

v<c 替换 为 <vo +e 
cv 替换 为 19 Sv -Co 
i) 11. 37 ase eee 
l= vi ww =10 


0s v3 <4 





v S vi 
20, <2,- 7 

变量 vi 的 常量 上 下 界 变 成 了 vo <0; -1 和 wi Svo + 
10; v2 和 v3 的 常量 界限 也 可 以 做 类 似 的 处 理 。 然 图 11221 例子 11.37 中 的 约束 的 图 形 表示 
后 , 把 最 后 一 个 约束 转换 成 v1 <v3 -4, 我 们 就 得 到 
图 11-21 中 显示 的 图 。 环 vi .v3 wo wv1 的 权重 为 -1, 因此 这 个 不 等 式 组 无 解 。 G 

记忆 模式 

因为 一 些 简单 的 访问 模式 会 在 整个 程序 中 重复 出 现 , 我 们 经 常 需 要 重复 求解 类 似 的 数据 依 
赖 关系 问题 。 提 高 数据 依赖 关系 的 处 理 速度 的 重要 技术 之 一 是 使 用 记忆 模式 (memoization) 。 这 
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个 模式 在 生成 一 个 问题 的 结果 之 后 就 把 这 个 结果 用 表格 记录 下 来 。 每 次 处 理 此 类 问题 的 时 候 ， 
算法 都 会 查询 这 个 表 。 只 有 在 表 中 找 不 到 被 处 理 问题 的 结果 时 才 需 要 从 头 求解 这 个 问题 。 
11. 6.5 解决 一 般 性 的 整数 线性 规划 问题 

现在 我 们 描述 一 个 解决 整数 线性 规划 问题 的 一 般 性 方法 。 这 个 问题 是 NP -完全 的 。 我 们 的 
算法 使 用 了 一 个 分 支 -界定 方法 , 这 种 方法 在 最 坏 情况 下 花费 的 时 间 为 指数 级 。 但 是 , 11. 6.4 市 
中 的 启发 式 规则 未 能 解决 问题 的 情况 很 少 出 现 。 并 且 即 使 我 们 需要 应 用 本 节 中 的 算法 ， 也 很 少 
需要 执行 算法 中 的 分 支 -界定 步骤 。 

这 个 方法 首先 检查 不 等 式 组 是 否 存 在 有 理 数 解 。 这 个 问题 是 标准 的 线性 规划 问题 。 如 果 不 等 
式 组 不 存在 有 理 数 解 ， 问 题 中 的 数组 访问 所 触及 的 数据 区 域 就 一 定 不 相交 , 因此 一 定 不 存在 数据 依 
赖 关 系 。 如 果 存 在 有 理 数 解 , 我 们 首先 试图 证 明 存 在 一 个 整数 解 (通常 会 有 这 样 的 解 ) 。 如 果 不 能 证 
明 这 一 点 , 我 们 就 把 这 个 不 等 式 组 界定 的 多 面体 分 割 为 两 个 较 小 的 问题 ， 并 递归 地 解决 问题 。 


考虑 下 面 的 简单 循环 : 


for Gi = 13 i < 10; i++) 
Z(i] = Z[i+10]; 


访问 Z[ 订 所 触及 的 元 素 是 Z[1] 2[9] ,而 访问 2Z02+10] 所 触及 的 元 素 是 Z[11]、…、\2[L19]。 
这 两 个 范围 并 不 相交 , 因此 不 存在 数据 依赖 关系 。 更 严格 地 讲 , 我 们 需要 说 明 不 存在 两 个 动态 访 
问 i 和 i 满足 1 <i <9, 1 <i! <9 且 i=i 记 +10。 如 果 存在 这 样 的 整数 i 和 六, 那么 可 以 用 六 +10 
FEAR i, 并 得 到 四 个 关于 的 约束 : 1 <i'<9 和 1 <i’ +10 <9, 但 是 , i' +10 <9 BAA’ < -1, 
这 和 1<i' 小 盾 。 因 此 不 存在 这 样 的 整数 i 和 说 。 口 

算法 11;39 描述 了 如 何 基 于 Fourier-Motzkin 消除 算法 来 确定 是 否 可 以 找到 一 组 线性 不 等 式 的 
整数 解 。 
整数 线性 规划 问题 的 分 支 界定 解法 。 

输入 ; 一 个 变量 vw,…; v, 上 的 多 面体 Sno 

输出 : WS, 有 一 个 整数 解 , 输出 "yes”, 否则 输出 “no” 。 

方法 : 图 11-22 中 给 出 的 算法 。 oO 





对 Sn SEBI oa 
» U1 按 顺 序 通 过 投影 消除 ; 
& S; ssl i t = Len SNIA, 其 中 
i=n-—l,n— 2: 0; 
if So HZ return “no 
Ke ei, 具有 不 可 满足 的 约束 ， 
就 不 存在 有 理 数 解 */ 
for (i = 1;i<n;it+) { 
if (S; 不 包含 整数 解 break; 
令 Gi 为 5; 中 vi 的 取 值 范围 正中 的 整数 值 ; 


把 vi 替换 为 c;， 修改 5;; 


if (i == n + 1) return “yes”; 
if (i == 1) return “no”; 
AS; 中 Ui 的 下 界 和 上 界 分 别 为 G 和 Wi; 
对 Sn U {vi < Lil} 和 Sh U {vi 之 fuil} 递归 应 用 
这 个 算法 且 Sn U {v; 之 wl}; 
if (有 一 个 结果 为 “yes”) return “yes” else return “no”; 





图 11-22 寻找 不 等 式 的 整数 解 
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第 1 行 到 第 3 行 试图 找 出 不 等 式 组 的 一 个 有 理 数 解 。 如 果 没 有 有 理 数 解 ,就 没有 整数 解 。 如 
果 找 到 一 个 有 理 数 解 , 就 表明 这 个 不 等 式 组 定义 了 一 个 非 空 的 多 面体 。 这 样 的 一 个 多 面体 不 包 
含 整数 解 的 情况 相对 较 少 一 一 要 是 出 现 这 种 情况 , 这 个 多 面体 在 某 些 维度 上 必然 很 薄 , 而 且 位 于 
整数 点 之 间 。 

因此 , 第 4 行 到 第 9 行 试图 快速 检查 是 否 存在 一 个 整数 解 。Fourier-Motzkin 消除 算法 的 每 一 
步 都 会 产生 一 个 多 面体 , 其 维度 比 前 一 个 多 面体 的 维度 小 1。 我们 反 向 考虑 这 些 多 面体 。 我 们 从 
只 有 一 个 变量 的 多 面体 开始 ; 在 可 能 的 情况 下 ， 向 这 个 变量 赋予 一 个 大 概 处 于 它 的 取 值 范围 中 间 
的 整数 值 。 然 后 , 我 们 在 所 有 其 他 的 多 面体 中 用 这 个 值 来 蔡 代 这 个 变量 ， 把 这 些 多 面体 的 未 知 量 
的 数目 减 一 。 不 断 重复 这 个 过 程 , 直到 所 有 的 多 面体 都 得 到 处 理 ， 或 者 找到 了 一 个 没有 整数 解 的 
变量 。 在 前 一 种 情况 下 , 我 们 可 以 找到 一 个 整数 解 。 

如 果 我 们 甚至 不 能 为 第 一 个 变量 找到 整数 值 ， 那么 整个 不 等 式 组 就 不 存在 整数 解 ( 第 10 
47). FM, 我 们 所 知道 的 全 部 情况 就 是 没有 哪个 整数 解 会 包含 至 今 为 止 我 们 为 一 些 变量 选择 的 
特定 整数 值 。 这 个 结论 不 是 决定 性 的 。 第 11 行 到 第 13 行 表示 算法 的 分 支 - 界定 步骤 。 如 果 发 
现 变 量 o 具有 有 理 数 解 但 是 没有 整数 解 ， 就 把 问题 中 的 多 面体 分 成 两 个 多 面体 , 第 一 个 要 求 v， 
必须 是 小 于 已 找到 的 有 理 数 的 整数 , 第 二 个 要 求 v 必须 是 一 个 大 于 此 有 理 数 解 的 整数 。 如 果 两 
个 多 面体 都 没有 整数 解 , 那么 就 不 存在 依赖 关系 。 

11.6.6 小 结 

我 们 已 经 说 明 一 个 编译 器 能 够 从 数组 引用 中 收集 到 的 信息 的 主要 部 分 和 某 些 标准 数学 概念 
等 价 。 给 定 一 个 访问 函数 .F= <F,f,B,b>: 

1) 被 访问 的 数据 区 域 的 维度 由 矩阵 F 的 秩 给 出 。 访问 同一 位 置 的 访问 空间 的 维度 就 是 五 的 
SK. MRA MERA EZ F F HRAN, 那么 这 两 个 迭代 指向 同一 个 数组 元 素 。 

2) 同一 个 数组 访问 的 具有 自 时 间 复 用 关系 的 多 个 迭代 之 间 的 差距 是 下 的 零 空间 中 的 向 量 。 
日 空 间 复 用 可 以 用 类 似 的 方式 计算 得 到 , 但 不 是 考虑 两 个 迭代 何 时 使 用 同一 个 元 素 , 而 是 考虑 它 
们 何 时 使 用 同一 行 元 素 。 两 个 访问 Fi, +f, 和 Fi, + fy 沿 着 向 量 d 的 方向 具有 易于 利用 的 局 部 性 ， 
其 中 4d 是 方程 Fd = (f, -fo) 的 某 个 解 。 特 别 是 当 qd 的 方向 和 最 内 层 循环 对 应 时 ， 即 d 为 向 量 [0， 
0,…,0,1] 时 , 如果 数组 是 按 行 存放 的 , 那么 就 会 存在 空间 局 部 性 。 

3) 数据 依赖 关系 间 题 一 一 两 个 引用 是 否 可 能 指向 同一 个 位 置 和 整数 线性 规划 等 价 。 两 
个 访问 函数 之 间 具 有 数据 依赖 关系 的 条 件 是 存在 值 为 整数 的 向 量 i 入， 使 得 Bi=0, B'i'=0, 并 
A Fi+f=F'i' +f’, 

11.6.7 11.6 节 的 练习 

练习 11.6.1: 找 出 下 列 整数 集合 的 GCD; 

1) {16,24,56} 

2) | -45,105,240} , 

! 3) {84,105 180,315,350} 。 

练习 11.6.2: 对 于 下 面 的 循环 


for (i = 0; i < 10; i++) 
A[i] = A[10-i]; 


指出 所 有 的 
1) 真 依赖 关系 ( 即 写 运算 后 跟着 对 同一 个 位 置 的 读 运算 ) 。 
2) 反 依 赖 关 系 ( 即 读 运算 后 跟着 对 同一 个 位 置 的 写 运算 )。 
.3) 输出 依赖 关系 ( 即 写 运算 后 跟着 对 同一 个 位 置 的 另 一 个 写 运算 )。 
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1 练习 11. 6. 3: 在 介绍 欧 风 里 得 算法 的 部 分 中 ;, 我 们 未 经 证 明 就 给 出 了 一 些 断 言 。 证 明 下 
面 的 每 一 个 断言 : 

1) 该 部 分 所 述 的 欧 几 里 得 算法 总 是 能 够 工作 。 特 别 地 ，gcd(2;c) =ged(a,b), 其 中 c 是 a/b 
的 非 零 余数 。 

2) ged(a,b) = ged(a, =b). 

3) 4n>2 Wt, ged(a,,a,,°-,a,) =ged(ged(a, saz) ,a3,°",a,) 6 

4) CCD 实际 上 是 一 个 整数 集合 上 函数 ， 即 整数 的 顺序 并 不 重要 。 说 明 CCD 的 交换 率 : 
ged(a,b) = ged(5,a)。 然 后 证 明 更 加 困难 的 结论 , 即 CCD 的 结合 律 : ged(ged(a,b),c) = ged(a, 
ged(b,c)). 最后, 说明 上 述 这 些 定律 蕴含 了 下 面 的 性 质 : 不 管 按 照 什么 样 的 顺序 来 计算 各 个 整 
数 对 的 GCD, 得 到 的 一 个 整数 集合 的 CCD 总 是 相同 的 。 

5) MRS 和 7 都 是 整数 集合 , 那么 gcd(SUT) = ged(ged(S) ,gcd(7))。 

| 练习 11. 6.4: 找 出 例 11. 33 中 的 第 二 个 丢 番 图 方程 的 另 一 个 解 。 

练习 11. 6.5: 在 下 面 的 情况 中 应 用 独立 变量 测试 。 循 环 赃 套 结构 是 


for (i=0; i<100; i++) 
for (j=0; j<100; j++) 
for (k=0; k<100; k++) 


EREA PPR BAT YS A, ME T A) | EE HE IK 
MÉR. 
1) Ali, j,k] = ALi+100,j+100,k+100] 
2) A[i,j,k] = A[j+100,k+100,i+100] 
3) A[i,j,x] = ALj-50,k-50,i-50] 
4) Ali,j,k] = ALit+99,k+100, j] 
练习 11. 6. 6: 在 下 面 的 约束 中 , 通过 把 x 替换 为 y( 原文 如 此 , 译 者 注 ) 的 常量 下 界 来 消除 x。 
1<x<y-100 
3<x<2y -50 
练习 11. 6.7: 对 下 面 的 约束 集合 应 用 循环 残 数 测试 : 
0<%7=<99 . yxx=50 
O<sys99 z<y-60 
0 三 z<99 
练习 11. 6.8: 对 下 面 的 约束 集合 应 用 循环 残 数 测试 : 
1<x<99 y<x-50 
Osy<99 zxy +40 
Os z<99 x= z+20 
练习 11. 6. 9: 对 下 面 的 约束 集合 应 用 循环 残 数 测试 : 
0<x<99 y<x-100 
Osy<99 z<y+60 


0s z<99 xs z+50 
11.7 寻找 无 同步 的 并 行 性 


我 们 已 经 得 到 了 关于 仿 射 数组 访问 , 访问 之 间 对 数据 的 复 用 , 以 及 它们 之 间 的 依赖 关系 的 理 
论 。 现 在 我 们 将 应 用 这 些 理论 来 对 实际 程序 进行 并 行 化 及 优化 处 理 。 如 11. 1.4 节 中 所 讨论 的 ， 
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在 找到 并 行 性 的 同时 保证 处 理 器 之 间 通 信 量 的 最 小 化 是 很 重要 的 。 我 们 首先 研究 如 何在 完全 不 
人 允许 处 理 器 之 间 进 行 通信 或 同步 的 情况 下 实现 并 行 化 的 问题 。 这 个 约束 可 能 看 起 来 像 是 一 个 纯 
学 术 的 练习 , 我 们 有 多 大 的 机 会 会 磁 到 具有 这 种 形式 的 并 行 性 的 程序 或 过 程 ? 实际 上 , 在 现实 生 
活 中 存在 很 多 这 样 的 程序 ,因此 解决 这 个 并 行 化 问题 的 算法 本 身 就 是 有 用 的 。 男 外 ， 可 以 扩展 解 
决 这 个 问题 时 使 用 的 概念 以 处 理 同 步 和 通信 。 
1.7.1 一 个 介绍 性 有 内 例 二 

图 11-23 中 显示 的 是 从 一 个 5000 行 的 Fortran 代码 程序 中 摘录 的 并 以 C 语言 表示 的 程序 片 
段 。 为 清晰 起 见 , 代码 中 仍然 保留 了 Fortran 风格 的 数组 访问 语法 。 原 来 的 程序 实现 了 用 来 解决 
三 维 欧 拉 方 程 的 多 重 网 格 算法 。 这 个 程序 的 大 部 分 运行 时 间 都 花费 在 少数 几 个 如 图 所 示 的 子 程 
序 上 。 它 是 很 多 数值 程序 的 典型 代表 。 这 些 数值 程序 经 常 由 很 多 处 在 不 同 藤 套 层次 上 的 for 循环 
组 成 。 它 们 包含 了 很 多 数组 访问 , 所 有 数组 访问 的 下 标 都 是 外 围 循 环 下 标的 仿 射 表达 式 。 为 了 
使 这 个 例子 比较 简短 , 我 们 已 经 从 原来 的 程序 中 删除 了 一 些 具有 类 似 性 质 的 代码 行 。 








forTtiia i212j++ 
for (i = 2, i <= il, i++) { 
AP [j,i] = 
T = 1. Gide 0 +-AP[j},i]); 
p(ayjjid = T*APL},i]; 
DWI1,2,j,4] = TeDWl1,2,5,,1]; 
} 
for (k = 3; k <= kl-1; k++) 
for! Gp 292387) <3) jay ate) 
for (i = 2; i <= il; i++) { 


AM[j,i] = AP[j,i]; 

AP[j,i] sje wes 

T MAAP, ih AME I+D Ee, ji] 

pikšjsil T*AP[j,i]; 

DW[1,k,j,i] = T*(DW[i,k, j,i] + DW[1,k-1,j,i])...; 
} 


for (k = kl1-1; k >= 2; k--) 
for G RH 7 <= g1;.j*)) 
for, (i. = ins il; 14+) 
DW[1,k,j,i] = DWEL, E, jli] + D(k,j,i]*DW[1,k+1,j,i]; 





Al 11-23 一 个 多 重 网 格 算法 的 代码 片断 


图 11:23 的 代码 在 一 个 标量 变量 7 和 一 些 具有 不 同 维 度 的 多 个 数组 上 运行 。 我 们 首先 来 看 一 
下 对 变量 7 的 使 用 。 因 为 一 个 循环 中 的 每 个 迭代 使 用 同一 个 变量 7, 我 们 不 能 并 行 执 行 这 些 迭 
代 。 但 是 7 只 是 用 于 存放 在 一 个 迭代 中 使 用 两 次 的 公共 子 表达 式 的 值 。 在 图 11-23 中 的 前 两 个 循 
HREF, 最 内 层 循 环 的 各 个 迭代 向 7 中 写 人 一 个 值 , 然后 立刻 在 同一 个 迭代 中 两 次 使 用 这 个 
值 。 我 们 可 以 把 对 7 的 每 次 使 用 替换 为 前 面 对 7 的 赋值 语句 的 右 部 表达 式 , 从 而 在 不 改变 程序 
语义 的 前 提 下 消除 依赖 关系 。 我 们 也 可 以 把 标量 了 替换 为 一 个 数组 。 Wa aCe TRY, i) 
使 用 它 自 己 的 数组 元 素 7[j,i]。 

经 过 这 样 的 修改 , 每 个 赋值 语句 中 对 一 个 数组 元 素 的 计算 只 依赖 于 最 后 两 个 下 标 分 量 值 (分 
别 是 7 和 让 相同 的 其 他 数组 元 素 。 因 此 , 我 们 可 以 把 对 各 个 数组 的 第 (j, 让 个 元 素 进行 操作 的 所 有 运 
算 组 合成 为 一 个 计算 单元 , 并 按照 原来 的 串 行 顺序 执行 它们 。 这 个 修改 产生 了 (i1L =1) x (i1 - 1) 
相互 独立 的 计算 单元 。 请 注意 , 原 程序 里 第 二 和 第 三 个 循环 钻 套 结构 涉及 下 标 为 的 第 三 个 循 
环 。 但 是 ,因为 具有 同样 的 7 和 ;i 值 的 动态 访问 之 间 不 存在 依赖 关系 , 所 以 可 以 安全 地 在 7 和 i 的 
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循环 内 部 一 一 就 是 说 在 一 个 计算 单元 中 一 一 执行 的 循环 。 

知道 这 些 计算 单元 是 独立 的 , 我 们 就 可 以 对 代码 进行 多 个 合法 的 转换 。 比 如 , 一 个 单 处 理 器 
系统 可 以 不 按照 原来 的 代码 执行 ,而 是 逐个 执行 独立 的 运算 单元 ,最 终 完 成 同样 的 计算 工作 。 转 
换 所 得 代码 显示 在 图 11224 中 。 这 个 代码 具有 更 好 的 时 间 局 部 性 , 因为 计算 中 生成 的 结果 立刻 就 
被 用 掉 了 。 





for (j = 2 d se jlin 
for (hei Oe <= Sis HA 


AP[j,i] Hig 
Ti] 1.0/(1.0 + AP[j,i]); 
DI2,j5 32] T(j,i] *APCj,i]; 


DW1,2,j,4] T(j,i] *DWL1,2,j,i]; 





人 


for (k = 3; k <= kl-1; k++) { 
AM[j ,i] APTS Sis 
AP[j,i] ed 
m.i ...AP[j,i] - AMCEJ,i]*D[k-1,j,4]...; 
D[k,j,iJ] TE] FAP Tis; 


DWI, k, jå] = TL. i) (WE, yj te DWIt kalj ilot; 
is 


for (k = kl-1; k(34,2; k-+) 
DW(1,k,j,i] = DWL1,k,j,i] + Dik,j,il]*DW[1,k+1,j,i]; 
} 





图 11-24 经 过 改写 的 图 11-23 的 代码 , 最 外 层 是 并 行 循 环 


这 些 独立 的 计算 单元 也 可 以 被 分 配给 不 同 的 处 理 器 并 行 执行 。 这 些 处 理 器 之 间 不 需要 任何 
同步 或 通信 。 因 为 有 ( j1 -1) x (i1 -1) 个 相互 独立 的 计算 单元 , 我 们 最 多 可 以 利用 (j1 -1) x 
(il -1) 个 处 理 器 。 我 们 可 以 按照 二 维 数 组 的 方式 组 织 处 理 器 , 每 个 处 理 器 的 ID 是 (j,i) , 其 中 
2< j<jl, 2< is i1, 由 各 个 处 理 器 执行 的 SPMD 程序 就 是 图 11-24 中 的 内 层 循环 的 循环 体 。 

上 面 的 例子 说 明了 寻找 无 同步 的 并 行 性 的 基本 方法 。 我 们 首先 把 计算 任务 分 解 成 尽 可 能 多 
的 独立 单元 。 这 个 分 解 揭示 了 可 行 的 调度 选择 。 然 后 , 我 们 依照 拥有 的 处 理 器 数目 把 这 些 计算 
单元 分 配给 各 个 处 理 器 。 最 后 ,我 们 生成 一 个 在 各 个 处 理 器 上 执行 的 SPMD 程序 。 

11.7.2 仿 射 空间 分 划 

如 果 一 个 循环 钳 套 结构 内 部 具有 上 个 可 并 行 化 的 循环 , 那么 这 个 循环 嵌 套 结构 就 有 度 的 并 
行 性 。 一 个 可 并 行 化 循环 的 不 同 选 代 之 间 不 存在 数据 依赖 关系 。 比 如 , 图 11-24 中 的 代码 就 具有 
2 度 并 行 性 。 把 具有 度 并 行 性 的 计算 任务 分 配给 一 个 k 维 的 处 理 器 阵列 是 很 方便 的 。 

一 开始 , 我 们 将 假设 处 理 器 阵列 的 每 个 维度 上 的 处 理 器 数目 和 相应 循环 的 迭代 个 数 一 样 多 。 在 
找到 所 有 这 些 独立 计算 单元 后 ,我们 将 把 这 些 “ 虚 拟 "处 理 器 映射 到 实际 的 处 理 器 上 。 在 实践 中 , 每 
个 处 理 器 要 负责 相当 多 的 迭代 , 否则 就 没有 足够 的 工作 量 来 分 挫 并 行 化 所 带 来 的 额外 开销 。 

我 们 把 需要 并 行 化 的 程序 分 解 成 为 类 似 于 三 地 址 语 名 这样 的 基本 语句 。 对 于 每 个 语句 , 我 

们 找 出 一 个 仿 射 空间 分 划 (affine space partition) 。 这 个 分 划 把 这 些 语句 的 各 个 动态 实例 映射 到 一 
个 处 理 器 ID。 这 些 动态 实例 使 用 其 循环 下 标 来 标记 。 
DERE 如 上 面 所 讨论 的 , 图 11-24 的 代码 具有 2 度 的 并 行 性 我 们 把 处 理 器 阵列 看 作 一 个 
二 维 空 间 。 令 (pi ,p2) 为 这 个 阵列 中 的 一 个 处 理 器 的 ID。 在 11.7.1 节 中 所 讨论 的 并 行 化 方案 可 
以 使 用 一 个 简单 的 仿 射 分 划 函 数 来 描述 。 在 第 一 个 循环 嵌 套 结构 中 的 所 有 语句 都 有 下 面 的 仿 射 
分 划 : 
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寻找 无 同步 并 行 性 的 算法 由 三 个 步 又 组 成 

1) 为 程序 中 的 每 个 语句 寻找 一 个 能 够 最 大 化 并 行 性 度数 的 仿 射 分 划 。 请 注意 , 我 们 通常 
把 语句 (而 不 是 单个 访问 ) 作为 计算 的 单元 。 对 于 一 个 语句 中 的 所 有 访问 必须 应 用 同样 的 仿 射 
分 划 。 这 种 对 访问 的 分 组 方法 是 有 意义 的 ,因为 在 同一 个 语句 中 的 访问 之 间 几 乎 总 是 存在 依 
赖 关系 。 

2) 在 处 理 器 之 间 分 配 由 第 1 步 得 到 的 独立 计算 单元 , 并 选择 在 每 个 处 理 器 上 执行 的 各 个 步 
又 之 间 的 交替 顺序 关系 ;这 个 分 配 主要 要 考虑 局 部 性 。 

3) 生成 一 个 将 在 各 个 处 理 器 上 执行 的 SPMD 程序 。 

下 面 我 们 将 讨论 如 何 寻 找 仿 射 分 划 函 数 , 如 何 生 成 一 个 顺序 程序 来 品行 执行 各 个 分 划 ， 以 及 
如 何 生 成 一 个 在 不 同 处 理 器 上 执行 各 个 分 划 的 SPMD 程序 。 在 从 11. 8 节 到 11. 9. 9 节 讨论 了 如 何 
处 理 带 有 同步 的 并 行 性 之 后 , 我 们 将 在 11. 10 节 回 到 上 面 的 第 2 步 ， 并 讨论 如 何 针对 单 处 理 右 和 
多 处 理 器 系统 进行 局 部 性 优化 。 

11. 7.3 空间 分 划 约 束 

因为 要 求 没有 通信 , 所 以 每 一 对 具有 数据 依赖 关系 的 运算 都 必须 被 分 配 在 同一 个 处 理 右 上 。 
我 们 把 这 些 约束 称 为 “空间 分 划 约 束 ”。 任 何 满足 这 些 约束 的 映射 所 创建 的 分 划 都 是 相互 独立 的 。 
请 注意 , 只 要 把 所 有 运算 都 放 到 一 个 分 划 单元 , 就 可 以 满足 这 样 的 约束 。 遗 憾 的 是 , 这 样 的 “ 解 ” 
没有 给 出 任何 并 行 性 。 我 们 的 目标 是 在 满足 这 些 空 间 分 划 约 束 的 同时 得 到 尽 可 能 多 的 独立 分 划 。 
也 就 是 说 ， 只 有 在 必要 的 时 候 才 会 把 不 同 的 运算 放 到 同一 个 处 理事 上 。 

当 我 们 限制 自己 只 考虑 仿 射 分 划 时 , 可 以 将 并 行 性 的 度数 ( 即 维度 ) 最 大 化 , 而 不 是 将 独立 
单元 的 数目 最 大 化 。 如 果 我 们 使 用 分 段 ( piecewise ) 仿 射 分 划 ， 有 时 有 可 能 创建 出 更 多 的 独立 单 
元 。 一 个 分 段 仿 射 分 划 把 单个 访问 的 实例 分 割 成 为 不 同 的 集合 , 并 允许 对 每 个 集合 使 用 不 同 的 
仿 射 分 划 。 但 是 这 里 我 们 不 考虑 这 样 的 选项 。 

正式 地 讲 , 一 个 程序 的 仿 射 分 划 是 无 同步 的 (synchronization free) 当 且 仅 当 对 于 两 个 具有 数 
据 依 赖 关系 的 (不 一 定 不 同 的 ) 访 问 , 即 在 循环 嵌 套 结构 di 中 的 语句 s 中 的 访问 和 = < Pi, 有 i， 
B,,b, > AVE ke AGP dy 中 的 语句 S2 中 的 访问 A KFI fo By Bs >, AA Sy All s5 的 分 划 
< Cl,cl > 和 <C ,cy > 满足 下 面 的 空间 分 划 约 束 (space-partition constraint) ; 

。 对 于 所 有 满足 下 列 条 件 的 Z4 中 的 让 A Ze Hi: 

1) B,i, +b, 20 

2) Boi, +b, >0 

3) Fii, +f, = Fain th 

Cii +c; = Ciy + ce, 一 定 成 立 。 

并 行 化 算法 的 目标 是 为 每 个 语句 找 出 满足 这 些 约束 的 具有 最 高 秩 的 分 划 。 

图 11225 中 的 图 说 明了 空间 分 划 约 束 的 本 质 。 假 设 有 两 个 静态 访问 分 别处 于 两 个 循环 肉 套 结 
构 中 , 它们 的 下 标 向 量 分 别 为 去 和 记 。 假 设 它们 共同 访问 了 至 少 一 个 数组 元 素 , 且 至 少 其 中 之 一 
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是 写 运算 ， 那么 它们 之 间 具 有 依赖 关系 。 根据 仿 射 访问 函数 Fiii +f, Al Foi, + fo, 该 图 显示 了 在 
这 两 个 循环 中 恰巧 访问 同一 个 数组 Seta 

元 素 的 动态 访问 。 除 非 这 两 个 静态 本 
访问 的 仿 射 分 划 Cii +e M Ci, + 4 
c, 把 它们 的 动态 访问 分 配 到 同一 个 
处 理 器 上 , 否则 不 同 处 理 器 之 间 必 = PF 
须 进 行 同步 。 

如 果 我 们 选择 一 个 仿 射 分 划 ， 00 
它 的 秩 为 所 有 语句 的 秩 的 最 大 值 ， 
那么 就 得 到 了 最 大 可 能 的 并 行 性 。 
但 是 , 在 这 种 划分 下 , 有些 处 理 器 口 口 口 
有 时 可 能 会 空闲 , 而 其 他 处 理 器 却 处 理 器 ID 
忙于 执行 那些 具有 较 小 秩 的 仿 射 分 图 11:25” 空 间 分 划 约 束 
划 的 语句 。 如 果 执 行 这 些 语句 的 时 
间 相 对 较 短 , 这 种 情况 还 是 可 接受 的 。 否 则 , 我 们 可 以 选择 秩 小 于 最 大 可 能 值 的 仿 射 分 划 ， 只 要 
这 个 分 划 的 秩 大 于 0 即 可 。 

在 例 11.41 中 , 我 们 给 出 了 一 个 用 于 说 明 这 个 技术 的 功能 的 小 程序 。 实 际 应 用 通常 要 比 这 个 
程序 简单 , 但 是 它们 的 边界 条 件 可 能 和 这 里 显示 的 一 些 问题 类 似 。 我 们 将 在 本 章 的 各 个 部 分 使 
用 这 个 例子 来 说 明 下 面 的 事实 : 具有 仿 射 访问 的 程序 具有 相对 简单 的 空间 分 划 约 束 , 这 些 约束 可 
以 通过 标准 线性 代数 技术 来 解决 , 并 且 最 终 需 要 的 SPMD 程序 能 够 从 仿 射 分 划 中 机 械 化 地 生成 。 
DERI 这 个 例子 说 明了 我 们 如 何 把 一 个 程序 的 空间 分 划 约 束 用 公式 表达 出 来 。 这 个 程序 显 
示 在 图 11-26 H, 它 由 具有 两 个 语句 si 和 s, 的 小 循环 嵌 套 结构 组 成 。 
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for d = 1: i <= 100; 13%) 
foxi (\=|13 71 <= 100 t+) 
Al EL YEi-t, ils. /* Cs) */ 


aJI = YEL JI 2 j Ts A -dd ek 
} 





图 11-26 一 个 用 以 说 明 相互 依赖 的 长 运算 链 的 循环 媒 套 结构 


我 们 在 图 11-27 中 显示 了 程序 中 的 数据 依赖 
KA. EA, 每 个 黑 点 表示 语句 si 的 一 个 实 j=4 e. 
例 , 而 每 个 白 点 表示 了 语句 s 的 一 个 实例 。 在 坐 an si, 
标 (i,j) 处 的 点 表示 该 语句 在 下 标 变 量 的 取 值 为 ”; =3 1 
(i, 让 时 的 实例 。 但 是 请 注意 , s 的 实例 位 于 对 应 
于 相同 (i,) 对 的 si 的 实例 的 下 方 , 因此 图 中 对 应 ”i =? 
于 7 的 垂直 刻度 要 比 对 应 于 i 的 水 平 刻度 长 。 


WER, X[i,j] 是 由 s1(i,j) 写 人 的 , (ij) i=! 
就 是 语句 si 对 应 于 循环 下 标 值 和 7 的 实例 。 之 
后 它 被 (i,j+1) 读 出 , A s (1,7) DATE s (i, i 
Jj+1) 之 前 执行 。 这 个 事实 解释 了 图 中 从 黑 点 到 图 11-27” 例 11.41 的 代码 中 的 依赖 关系 
白 点 的 垂直 篆 头 。 类 似 地 , Yi) sij) SAB 
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Hs (Gt DRE, 这 个 事实 解释 了 从 白 点 到 黑 点 的 箭头 。 

从 图 中 很 容易 看 出 , 代码 可 以 被 并 行 化 为 无 同步 关系 的 几 个 部 分 , 方法 是 把 各 个 相互 依赖 的 
运算 链 分 配给 同一 个 处 理 器 。 但 是 , 写 出 一 个 实现 这 样 的 映射 方案 的 SPMD 程序 并 不 容易 。 在 原 
来 的 程序 中 每 个 循环 有 100 个 迭代 ,因此 存在 200 个 运算 链 。 在 这 些 运算 链 中 , 其 中 的 一 半 由 s 
开始 并 以 si 结束 , 另 一 半 从 sy 开始 并 以 s 结束 。 这 些 链 的 长 度 从 1 ~ 100 个 迭代 不 等 。 

因为 有 两 个 语句 ,所 以 我 们 需要 为 每 个 语句 寻找 一 个 仿 射 分 划 。 我 们 只 需要 表示 出 一 维 仿 
射 分 划 的 空间 分 划 约 束 。 这 些 约 束 稍 后 将 由 试图 寻找 所 有 独立 的 一 维 仿 射 分 划 的 解 方法 所 使 用 。 
这 个 方法 还 将 把 这 些 一 维 分 划 组 合 起 来 得 到 多 维 仿 射 分 划 。 因 此 , 我 们 可 以 把 每 个 语句 的 仿 射 
分 划 表示 为 一 个 1x2 的 矩阵 和 一 个 1 xl 的 向 量 , 并 把 下 标 向 量 [i, 站 转换 成 为 一 个 处 理 器 的 纺 
号 。 令 <[CiCiz] sepa. < [Ca Cn], [e] > HATA) s, Fil sp 的 一 维 仿 射 分 划 。 

我 们 将 应 用 六 个 数据 依赖 测试 : 

1) 语句 si 中 的 写 访问 X[i, 站 和 其 自身 之 间 的 依赖 关系 。 

2) 语句 si 中 的 写 访问 X[i, 站 和 读 访 问 X[i, 站 之 间 的 依赖 关系 。 

3) 语句 si PMS Xli, j AA s 中 的 读 访问 在世 7- 1] 之 间 的 依赖 关系 。 

4) 语句 ss 中 的 写 访问 Y[i, 让 和 其 自身 之 间 的 依赖 关系 。 

5) 语句 s 中 的 写 访问 Y[i, 站 和 读 访问 Y[i, 媳 之 间 的 依赖 关系 。 

6) 语句 ss 中 的 写 访问 Y[i, 站 和 语句 s1 中 的 写 访问 Yli -1 让 之 间 的 依赖 关系 。 

我 们 可 以 看 到 , 这 些 依赖 关系 测试 都 很 简单 , 而且 高 度 重复 。 这 个 代码 中 出 现 的 依赖 关系 发 
生 在 第 (3) 种 情况 下 访问 X[i, 站 和 X[i,j-1] 的 实例 之 间 以 及 第 (6) 种 情况 下 访问 Y[i,j] 和 Y[i 
-1, 媳 的 实例 之 间 。 

由 语句 si 中 的 X[i, 门 和 ss 中 的 X[i,j-1] 之 间 的 数据 依赖 关系 而 导致 的 空间 分 划 约 束 可 以 
表示 成 下 列 各 项 ; 

对 于 所 有 满足 下 面条 件 的 (7 力 和 (7 ) 

1<i<100 1sj <100 
1<i’<100 1<sj'<100 
i ae J = 了 -1 
我 们 有 
[Cu Ciz] [jl +[e,] = [Cy Cy | [a +[cz] 


也 就 是 说 , 前 四 个 条 件 是 说 (i,j) 和 (i', 六 ) 处 于 这 个 循环 虞 套 结构 的 迭代 空间 中 , 后 两 个 条 
件 是 说 动态 访问 X[i, 四 和 X[i,j-1] 触 及 同一 个 数据 元 素 。 我 们 可 用 类 似 的 方法 得 到 针对 语句 
s 中 的 访问 Y[i-1, 7] AGA s, 中 的 访问 Y[i, 站 的 空间 分 划 约 束 。 回 
11.7.4 求解 空间 分 划 约 束 

一 旦 抽取 得 到 空间 分 划 约 束 之 后 , 我 们 就 可 以 使 用 标准 线性 代数 技术 来 寻找 满足 这 个 约束 
的 仿 射 分 划 。 让 我 们 首先 说 明 如 何 找 出 例 11. 41 的 解 。 
DEEA 我们 可 以 使 用 下 面 的 步 台 来 找 出 例 11.41 的 仿 射 分 划 : 

1) 建立 例 11. 41 中 显示 的 空间 分 划 约 束 。 我 们 在 决定 数据 依赖 关系 的 时 候 使 用 了 循环 界限 ， 
但 是 在 算法 的 其 余部 分 不 再 使 用 循环 界限 。 

2) 在 不 等 式 中 的 未 知 变量 是 is ee i. Cy ` C12、 Cis Cry ` Cy 和 C20 根据 访问 函数 可 得 到 
等 式 i= 六 和 j= 六 -1。 使 用 这 些 等 式 来 减少 未 知 量 的 数目 。 我 们 使 用 高 斯 消除 法 来 完成 这 个 下 
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YE, 它 把 四 个 变量 减少 为 两 个 变量 , 也 就 是 说 =i =i At, =f =7' 一 1。 分 划 的 等 式 变 为 
t 
[Cu -Cy Cy ~ C22 | [| +[c1 —¢, - C2] =0 


3) 上 面 的 等 式 对 于 所 有 的 与 Mi 组 合 都 成 立 。 因 此 必然 有 下 面 的 结论 : 
Cy, = Cy, =0 
Ciz — Cy, =0 
ci -c2 — Coy =0 
如 果 我 们 对 访问 Y[i -1,j] 和 Y[i,j] 之 间 的 约束 执行 同样 的 处 理 步 骤 , 我 们 得 到 
Cy; ~ Ca =0 
C12 — Cy =0 
Cy = Cp + Cy, =0 
把 所 有 这 些 约束 一 起 进行 简化 , 我 们 得 到 下 面 的 关系 : 
Cy 3 Cy = Oye ~ Cyc 
4) 找 出 那些 只 涉及 系数 矩阵 中 的 未 知 量 的 等 式 的 所 有 独立 解 。 在 这 一 步 中 忽略 常量 向 量 中 
的 未 知 量 。 在 系数 矩阵 中 只 有 一 个 独立 的 选择 ,因此 我 们 寻找 的 仿 射 分 划 的 秩 最 多 为 一 。 为 了 
使 得 分 划 尽 量 简单 ,我 们 把 Cu 设置 为 1。 我 们 不 能 把 0 赋值 给 C11 ,因为 这 会 建立 一 个 零 秩 的 系 
BE, 零 秩 矩阵 会 把 所 有 的 和 迭代 都 映射 到 同一 个 处 理 器 上 。 由 Cy =1 可 得 Cr=1lC2 = -1， 
Cy =l. 
5) 找 出 常数 项 。 我 们 知道 常数 项 之 间 的 差 cp - ci 必须 是 -1。 但 是 我 们 必须 选择 实际 的 值 。 
为 了 使 分 划 简单 , 我们 选择 cx =0, 因此 el = -1。 
令 p 为 执行 迭代 (i,) 的 处 理 器 的 太 。 这 个 仿 射 分 划 用 p 表示 就 是 


tpl- -rt 


“tpl a1 -1]['] +00] 


也 就 是 说 ,si 的 第 〈z:7) 个 迭代 被 分 配给 处 理 器 P=i -7-1; 而 ss 的 第 (i,j) 个 迭代 被 分 配给 
处 理 器 P=;i —jo O 
找 出 一 个 程序 的 具有 最 高 秩 的 无 同步 仿 射 分 划 。 

输入 : 一 个 带 有 仿 射 数组 访问 的 程序 。 

输出 : 一 个 分 划 。 

方法 : 执行 下 列 步骤 : 

1) 找 出 程序 中 所 有 的 具有 数据 依赖 关系 的 访问 对 。 对 于 每 一 对 具有 数据 依赖 关系 的 访问 : 
REETA di 中 的 语句 si 的 访问 A = <F,,f,,B,,b, > MRE dy 中 的 语句 > 的 访问 
Fy = <Fy fy, By by >。 令 <Cl,cl> 和 <C,c > 分 别 是 语句 sj All sy 的 (当前 未 知 的 ) 分 划 。 相 
应 的 空间 分 划 约 束 表明 对 于 分 别处 于 各 自 循 环 界限 中 的 直 Pd, 如 果 

Fii +f, = Fin th, 
那么 
Ciii +e, =C2i +c, 


我 们 将 护 展 迭 代 的 域 , 使 之 包含 24 PARA i 和 22 PATA iy. 也 就 是 说 , 假设 所 有 的 界限 都 
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是 从 负 无 穷 大 到 正 无 穷 大 。 这 样 的 假设 是 有 道理 的 , 因为 一 个 仿 射 分 划 不 能 利用 如 下 的 性 质 : 一 
个 下 标 变 量 的 取 值 范围 是 一 个 有 限 整 数 集合 。 

2) 对 于 每 一 对 相互 依赖 的 访问 , 我 们 减少 其 下 标 向 量 中 的 未 知 量 的 数目 。 

© 请 注意 Fi +f 和 向 量 


on 


相同 。 也 就 是 说 , 通过 在 列 向 量 i 的 底部 加 上 一 个 额外 的 分 量 1, 我 们 可 以 使 列 向 量 了 成 为 
附加 到 矩阵 素 中 的 最 后 二 列 盖 这样， 可 以 把 访问 函数 的 等 式 Fiil +f, = Fob +h 改写 为 
i 
LEITIR (fi -f,) | i, |=0 
1 
® 一 般 来 说 , 上 面 的 等 式 具有 多 个 解 。 但 是 , 我们 仍然 可 以 使 用 高 斯 消除 法 尽 可 能 地 求解 
这 个 关于 分 量 i Mi, 的 方程 组 。 也 就 是 说 , 尽量 多 地 消除 变量 , 直到 只 剩 下 无 法 消除 的 变量 为 


止 。 最 后 得 到 的 计 Mi, 的 解 将 具有 如 下 形式 











-0[ 


其 中 是 一 个 上 三 角形 矩阵 , t 是 一 个 由 取 值 范围 为 所 有 整数 的 自由 变量 组 成 的 向 量 。 
© 我 们 可 以 使 用 步骤 2@ 中 的 技巧 来 改写 关于 分 划 的 等 式 。 用 步 又 2 的 结果 替代 同 量 
(i; ,i ,1) , 我们 可 以 把 关于 分 划 的 约束 写成 


[C,-C, (cl -clz[] =0 


3) 舍弃 和 分 划 无 关 的 变量 。 上 面 的 等 式 对 所 有 的 都 成 立 的 条 件 是 
[C,-C, (e,-¢,) ]U=0 

把 这 些 等 式 改 写成 4x =0 的 形式 , 其 中 x 是 一 个 由 仿 射 分 划 的 所 有 未 知 系数 组 成 的 向 量 。 

4) 找 出 这 不 仿 射 分 划 的 秩 并 求解 系数 矩阵 。 因 为 一 个 仿 射 分 划 的 秩 和 分 划 中 常量 项 的 值 无 
关 , 所 以 消除 所 有 来 自 于 cy Al cy 等 常量 向 量 的 未 知 量 , 从 而 把 Ax = 0 替换 为 经 过 简化 的 约束 
A'x' =0 。 找 出 A'%'=0 的 解 ,并 把 它们 表示 为 B, 也 就 是 可 以 生成 4' 的 零 空 间 的 一 组 基本 向 量 
的 集合 。 

5) 找 出 常量 项 。 从 如 中 的 每 个 基本 向 量 中 得 到 所 求 仿 射 分 划 的 一 行 , 并 使 用 Ax =0 来 获得 
常量 项 。 口 

请 注意 , 步骤 3 忽略 了 因 循 环 界限 而 加 在 变量 + 上 的 约束 。 由 此 而 得 到 的 仿 射 分 划 约 束 会 更 
加 严格 ,因此 这 个 算法 一 定 是 安全 的 。 也 就 是 说 , 我 们 在 假设 上 可取 任意 值 的 情况 下 生成 了 对 C 
Alc 的 约束 。 可 以 想象 , 如 果 考 虑 到 对 变量 i 的 约束 会 使 得 t 不 可 能 取 某 些 值 , 那么 可 能 还 会 存 
在 一 些 C 和 < 的 其 他 解 。 没 有 搜寻 这 样 的 解 会 使 我 们 失去 一 些 优化 的 机 会 , 但 不 会 使 得 被 处 理 
的 程序 所 完成 工作 和 原 程序 不 同 。 
11.7.5 一 个 简单 的 代码 生成 算法 

算法 11.43 生成 了 能 够 把 计算 任务 分 割 成 独立 分 划 单元 的 仿 射 分 划 。 因 为 分 划 单 元 之 间 是 
相互 独立 的 ;因此 它们 可 以 被 任意 分 配 到 不 同 处 理 器 士 。 一 个 处 理 器 可 以 被 分 配给 多 个 分 划 单 
元 , 并 且 处 理 器 可 以 交替 执行 分 配给 它 的 分 划 单元 。 但 是 每 个 分 划 单 元 中 的 运算 需要 顺序 执行 ， 


i 
i, 
1 
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这 是 因为 它们 之 间 通 常 具 有 数据 依赖 关系 。 

为 一 个 给 定 的 仿 射 分 划 生 成 一 个 正确 的 程序 相对 容易 一 些 。 我 们 首先 介绍 算法 11. 45。 
这 是 一 个 简单 的 代码 生成 方法 ， 它 能 够 为 单 处 理 器 系统 生成 顺序 地 执行 各 个 独立 分 划 单 元 的 
代码 。 这 样 的 代码 优化 了 时 间 局 部 性 , 因为 对 相同 数组 元 素 的 多 次 数组 访问 在 时 间 上 相当 千 
近 。 不 仅 如 此 , 这 个 代码 很 容易 被 转换 成 为 一 个 SPMD 程序 , 这 个 程序 在 不 同 的 处 理 器 上 执行 
名 个 分 划 单元 。 遗 憾 的 是 , 这 样 生成 的 代码 是 低 效 的 , 我 们 下 一 步 将 讨论 使 这 些 代码 高 效 执 
行 的 优化 方法 。 

我 们 的 基本 恩 想 如 下 。 我 们 已 经 知道 了 一 个 循环 嵌 套 结构 的 各 个 下 标 变量 的 界限 ,也 在 算 
法 11.43 中 确定 了 某 个 语句 * 中 的 访问 的 分 划 。 假 设 我 们 希望 生成 一 个 能 够 顺序 执行 各 个 处 理 器 
上 的 动作 的 代码 , 那么 可 以 创建 一 个 最 外 层 的 循环 , 该 循环 遍历 各 个 处 理 器 ID。 也 就 是 说 , 这 个 
循环 的 每 个 迭代 执行 了 分 配给 某 个 处 理 器 ID 的 运算 。 原 来 的 程序 作为 这 个 循环 的 循环 体 被 插入 
到 代码 中 。 另 外 ,对 代码 中 的 每 个 运算 都 增加 了 一 个 测试 条 件 作 为 卫 式 ,以 保证 每 个 处 理 器 只 执 
行 赋予 它 的 运算 。 通 过 这 个 方法 , 我 们 保证 一 个 处 理 器 按照 原来 的 顺序 执行 了 所 有 赋予 它 的 
指令 。 
EEJ 我们 希望 生成 能 够 顺序 执行 例 11.41 中 的 各 个 独立 分 划 单元 的 代码 。 原 来 的 顺序 程 
序 来 自 图 11-26, 我 们 在 图 11-28 中 重复 这 段 


for Gi = 1; i <= 100; i++) 
代码 。 for (j = 1; j <= 100; j++) { 


在 例 11.42 中 , 仿 射 分 划算 法 找到 了 度 x[i,j] = Xfi,j) + Yli-t,j]; /* (st) */ 
数 为 一 的 并 行 性 。 因 此 , 处 理 器 空间 可 以 用 YL Yia + X(i,j-1]; /* (62) #/ 
单个 变量 p 表示 。 请 回忆 一 下 , 我 们 在 那个 
例子 中 选择 了 如 下 的 仿 射 分 划 , 对 于 所 有 满 图 11-28 重复 图 11-26 
kL 1<i<100 和 1<j<100 的 下 标 变 量 i 和 j: 

1) 将 语句 si 的 实例 (i, 让 分 配给 处 理 器 p=i-j-1。 

2) 将 语句 ss 的 实例 (i, 让 分 配给 处 理 侨 p=i-j。 

我 们 可 以 分 三 步 生 成 代码 : 

1) 对 于 每 个 语句 ， 找 出 所 有 参与 该 语句 计算 的 处 理 器 的 四。 我们 把 约束 1<i<100 及 
1<j<100 和 等 式 p =i-j-1 和 p=i-j 中 的 一 个 组 合 起 来 , 并 通过 投影 消除 i 和 j, 得 到 新 的 约束 。 

D 如 果 我 们 使 用 为 语句 si 得 到 的 函数 p=i-j-1, BARB - 100<p<%8, 

@ 如 果 我 们 使 用 语句 > 的 函数 p =i-j, 那么 得 到 -99< p<99。 

2) 找 出 所 有 参与 了 任 一 语句 的 计算 工作 的 处 理 器 的 ID, 我们 取 这 些 范围 的 并 集 , 得 到 
-100< p<99, 这 些 界 限 足以 覆盖 语句 st 和 ss 的 所 有 的 实例 。 

3) 生成 能 够 顺序 遍历 每 个 分 划 单 元 中 的 计算 工作 的 代码 。 图 11-29 中 显示 的 代码 有 一 个 
外 层 循 环 ， 它 迭代 遍历 了 所 有 参与 计算 的 分 划 单 元 的 加 (第 1 行 )。 在 第 2 行 和 第 3 行 ， 每 个 
分 划 单元 都 会 经 历 原 串 行程 序 生成 所 有 迭代 下 标的 过 程 , 然后 它 可 以 选 出 应 该 由 处 理 器 p 执 
行 的 兴 代 。 第 4 行 和 第 6 行 的 代码 保证 了 只 有 当 处 理 器 p 应 该 执行 语句 s1 和 ss 时 ,这 两 个 语 
句 才 可 以 执行 。 

虽然 生成 的 代码 是 正确 的 , 但 是 特别 低 效 。 首 先 , 虽然 每 个 处 理 器 最 多 执行 9 个 迭代 的 计 
算 任务 , 但 是 它 生 成 了 100 x100 个 迭代 的 循环 下 标 值 ， 比 必须 的 下 标 值 数目 多 了 一 个 量 级 。 其 
次 ,最 内 层 循环 的 每 一 个 加 法 都 带 有 一 个 条 件 测试 , 在 原 有 开销 上 又 增加 了 一 个 常量 因子 。 这 两 
种 低 效率 问题 的 处 理 将 分 别 在 11.7.6 节 和 11.7.7 节 中 处 理 。 口 
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1) for (p = -100; p <= 99; pt+) 

2) for (i = 15 i <=-100; it+) 

3) for (j = 1; j <= 100; j++) { 
4) if (p == i-j-1) 

5) X(i,j] = XC4,9] + YCi-t,j];, e */ 
6) if (p == i-j) 

Y(i,j] = X(i,j-1] Yj /* (s2) */ 





11-29 ”图 11-28 中 的 代码 的 简单 改写 , Ce EAT ANE al AS aT 


虽然 图 11.29 的 代码 看 起 来 被 设计 成 在 单 处 理 器 上 执行 的 代码 , 但 我 们 将 把 第 2 行 到 第 8 17 
的 内 层 循环 拿 出 来 在 200 个 不 同 的 处 理 器 上 执行 它们 。 每 个 处 理 器 都 有 一 个 不 同 的 从 - 100 ~99 
的 p 值 。 只 要 我 们 安排 得 当 , 使 得 每 个 处 理 器 都 知道 各 自负 责 p 的 哪些 值 , 并 且 只 执行 对 应 于 这 
些 值 的 第 2 行 到 第 8 行 代码 , 那么 就 可 以 在 少 于 200 个 处 理 器 上 分 划 内 层 循环 的 计算 。 
创建 顺序 执行 二 个 程序 的 各 个 分 划 单 元 的 代码 。 

输入 : 一 个 具有 仿 射 数组 访问 的 程序 P。 程 序 中 的 每 个 语句 * 具有 形 如 Bi +b, >0 的 界限 ， 
其 中 i 是 s 所 在 循环 赔 套 结构 的 循环 下 标 变量 的 向 量 。 每 个 语句 s 还 附 有 一 个 分 划 Cite =P, 
其 中 p 是 一 个 由 表示 处 理 器 ID 的 变量 组 成 的 m 维 向 量 。 m 是 程序 P 中 的 各 个 语句 的 分 划 的 秩 的 
最 大 值 。 

输出 : 二 个 等 从 于 了 的 程序 , 但 是 它 在 处 理 器 空间 上 (而 不 是 原来 的 循环 下 标 上 ) aE TTI AN 
遍历 。 

方法 : 执行 下 列 各 步 又 
1) 对 于 每 个 语句 , 使 用 Fourier-Motzkin 消除 法 从 界限 中 通过 投影 消除 所 有 的 循环 下 标 变量 。 

2) 使 用 算法 11. 13 来 决定 分 划 单元 D 的 界限 。 

3) 为 处 理 器 空间 的 m 个 维度 中 的 每 一 维 生 成 一 个 循环 。 令 p = [Pp1,Pz，…,Pn] 为 这 些 循环 
的 变量 的 向 量 。 也 就 是 说 , 对 于 处 理 器 空间 的 每 一 个 维度 都 有 一 个 变量 。 每 个 循环 变量 pi 遍历 
程序 已 中 所 有 语句 的 分 划 空间 的 并 集 。 

请 注意 ,分 划 空 间 的 并 集 不 一 定 是 凸 的 。 为 了 保证 算法 简单 , 我们 不 必 做 到 只 枚 举 那些 确实 
有 计算 任务 的 分 划 单 元 ; 我 们 可 以 把 每 个 Pi 的 下 界 设置 为 由 各 个 语句 确定 的 全 部 下 界 的 最 小 值 ， 
并 把 每 个 的 上 界 设置 为 由 各 个 语句 确定 的 全 部 上 界 的 最 大 值 。 因 此 p 的 某 些 取 值 可 能 没有 
运算 。 

由 每 个 分 划 单元 执行 的 代码 就 是 原来 的 串 行程 序 。 但 每 个 语 名 都 带 有 一 个 断言 作为 卫 式 条 
件 ,以 保证 只 有 属于 这 个 分 划 单 元 的 代码 才 会 被 执行 。 a 

我 们 很 快 就 会 给 出 算法 11. 45 的 一 个 例子 。 但 是 请 记 住 , 要 得 到 典型 例子 的 优化 代码 还 有 很 
多 工作 要 做 。 
11.7.6 消除 空 迭 代 

现在 我 们 讨论 生成 高 效 SPMD 代码 所 必须 的 两 个 转换 中 的 第 一 个 。 每 个 处 理 器 执行 的 代码 
循环 遍历 原 程序 中 的 所 有 迭代 , 并 选择 应 该 由 它 执行 的 运算 。 如 果 代码 具有 k 度 的 并 行 性 , BRA 
做 的 后 果 就 是 每 个 处 理 器 的 工作 量 增 大 了 大 个 数量 级 。 第 一 个 转换 的 目的 是 收 紧 循环 的 界限 以 
便 消除 所 有 的 空 迭 代 。 

首先 我 们 逐条 考虑 程序 中 的 语句 。 由 一 个 分 划 单元 执行 的 一 个 语句 的 和 迭代 空间 是 原来 的 先 
代 空 间 加 上 念 射 分 划 给 出 的 约束 。 我 们 可 以 把 算法 11. 13 应 用 到 新 的 迭代 空间 , 为 每 个 语句 生成 
二 个 紧 致 的 界限 。 新 的 下 标 向 量 和 原 顺序 程序 的 下 标 向 量 类 似 , 但 加 上 了 处 理 器 D 作为 最 外 层 
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的 下 标 。 请 注意 ,这 个 算法 会 为 每 个 下 标 生成 以 外 围 下 标 表示 的 紧 致 的 界限 。 
在 找到 不 同 语句 的 迭代 空间 之 后 , 我 们 按照 逐个 循环 的 方式 把 它们 组 合 起 来 , 使 得 下 标的 界 
限 为 各 个 语句 的 界限 的 并 集 。 如 下 面 的 例 11. 46 所 示 , 最 后 有 些 循环 可 能 只 有 -一个 迭代 , 我 们 可 
以 简单 地 消除 这 个 循环 ， 并 直接 把 循环 下 标 设置 为 该 送 代 对 应 的 值 。 
对 于 图 11-30a 中 的 循环 , 算法 11. 43 将 生成 仿 射 分 划 
31: 了 =17 
s p=] 
算法 11.45 将 生成 图 11-30b 中 的 代码 。 对 语句 5 应 用 算法 11. 13 BV p<i<p, Mi=p X 
似 地 ,这 个 算法 确定 对 于 语句 s, 有 j=p。 这 样 我 们 就 得 到 了 图 11-30c 所 示 的 代码 。 对 变量 i 和 j 
的 传播 将 会 消除 不 必要 的 测试 而 得 到 图 11-30d 中 的 代码 。 口 


for (p=1; p<=N; p++) { 
for (i=1; i<=N; i++) 
if (p == i) 


Ylik =. ZLil A /*, st) */ 
for (j=1; j<=N; j++) 
if ep Saupe oe 
XL] = YCj]; /* (s2) */ 


for (i=1; i<=N; i++) 

YCi] = Z[i]; /* (81). */ 
for (j=1; j<=N; j++) 

XCJ] = Yj]; /* (s2) */ 





a) 初始 代码 b) 应 用 算法 11.45 后 得 到 的 代码 


for (p=1; p<=N; p++) { 

ASPs 

if (p == i) 
Ya) = Zils Wr Csi) +/ 
j = p; for (p=1; p<=N; p++) { 

Yip] = Z[p]; /* (s1) */ 


j 
X[j] = Y[j]; /* (s2) */ Xip] =Y [p]; /* (s2) */ 





c) 应 用 算法 11.13 后 得 到 的 代码 中 最 终 的 代码 


图 11-30 例 11.46 的 代码 


现在 我 们 回 到 例 11. 44, 并 说 明 把 不 同 语句 的 多 个 迭代 空间 合并 到 一 起 的 步 又。 
呈现 在 让 我 们 收 紧 例 11. 44 中 代码 的 循环 界限 。 由 分 划 单元 p 执行 的 语句 si WERA 
间 由 下 面 的 等 式 和 不 等 式 定义 : 
-100<p<99 
1<i<100 
1<j<100 
i-p-1=j 
对 上 面 的 算式 应 用 算法 11. 13 生成 了 图 11-31a 中 显示 的 约束 。 算 法 11. 13 MYR i-p -1 =; 
All 1 <j<100 生成 约束 p+2<i<100 +p+1, 并 把 p 的 上 界 收 紧 为 98。 类 似 地 ,对 于 语句 s2 的 各 
个 变量 的 界限 在 图 11-31b 中 显示 。 
图 11-31 中 语句 si 和 sz 的 迭代 空间 是 相似 的 , 但 是 如 图 11-27 中 所 期 望 的 ,两 个 空间 在 某 些 界 
限 上 相差 1。 图 11-32 让 的 代码 在 这 两 个 迭代 空间 的 并 集 上 运行 。 比 如 ; 使 用 max(1,p +1) 作 为 i 的 
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下 界 ,min(100,100 +p +1) 作 为 其 上 界 。 请 注意 ， 最 内 层 循环 在 第 一 次 和 最 后 一 次 执行 时 只 有 一 个 
迁 代 ,而 在 其 他 情况 下 有 两 个 选 代 ;生成 循环 下 标的 开销 因此 降低 了 一 个 数量 级 。 因 为 被 执行 的 迭 
代 空 间 比 s Fils, 的 迭代 空间 都 大 , 在 执行 这 些 语句 的 时 候 仍然 需要 使 用 条 件 判断 来 进行 选择 。 口 


i—-p—1 
100 


100+p+1 


100 


< 98 








a) 语句 si 的 界限 b) 语句 5 的 界限 
图 11-31 图 11229 中 p、i 和 j 的 较 紧 致 的 界限 


11.7.7 ”从 最 内 层 循环 中 消除 条 件 测试 

第 二 个 转换 是 从 内 层 循环 中 消除 条 件 测试 。 如 上 面 的 例子 所 示 , 如 果 循 环 中 各 个 语句 的 先 
代 空 间 相交 但 是 不 重合 ,就 需要 保留 条 件 测试 语句 。 为 了 消除 对 条 件 测试 的 需求 , RIERS 
间 分 割 成 为 子 空间 , 每 个 子 空间 执行 同样 的 语句 集 合 。 这 个 优化 过 程 要 求 复制 代码 , 且 只 应 该 用 
于 消除 内 层 循环 的 条 件 测试 。 

为 了 分 割 一 个 迭代 空间 以 消除 内 层 循环 的 条 件 测试 , 我 们 重复 应 用 下 列 步骤 直到 消除 内 层 
循环 中 的 所 有 条 件 测试 : 

1) 选择 一 个 由 界限 不 同 的 多 个 语句 组 成 的 循环 。 

2) 使 用 一 个 条 件 来 分 割 循 环 , 使 得 某 个 语句 从 至 少 一 个 分 循环 中 被 噜 除 。 我 们 从 相互 重 倒 
的 不 同 多 面体 的 边界 中 选择 这 个 条 件 。 如 果 某 个 语句 的 所 有 和 迭代 都 只 位 于 这 个 条 件 的 某 个 半 个 
平面 中 , 那么 这 个 条 件 就 是 有 用 的 。 

3) 为 每 一 个 迭代 空间 生成 代码 。 

EEJ 让 我 们 从 图 11-32 的 代码 中 删除 条 件 测试 。 除 了 在 两 端的 边界 分 划 单元 ， 语 名 


si All sy 被 映射 到 同一 个 分 划 单 元 
ID, Aik, 我 们 把 分 划 空 间 分 戌 三 | FOF (P= 1005 p < 99; p 


for (i = max(1,p+1); i <= min(100,101+p); i++) 





个 子 空间 : 0 
if (p == i-j-1) 
1) pe en xj XCi,j] + Yi-1,j]; /* (st) */ 
2) -99<p<98 if (p == 1-1) 
3) p=99 Y(i,j] = X(i,j-1] + Y(i,j]; /* (s2) */ 
然后 , 就 可 以 针对 每 个 子 空间 
中 所 包含 的 p 的 值 对 它 的 代码 进行 图 11-32” 通过 收 紧 循环 界限 进行 改进 之 后 的 
特 化 。 图 11-33 中 显示 了 这 三 个 迭 图 11-29 的 代码 
代 空 间 的 代码 。 


请 注意 , 第 一 个 和 第 三 个 空间 不 需要 i 或 j 的 循环 , 因为 定义 这 两 个 空间 的 p 值 是 确定 的 , 这 
些 循环 都 是 退化 的 , 它们 只 有 一 个 迭代 。 比 如 , 在 空间 1 中 , 在 循环 界限 中 把 p 替换 为 - 100 会 
把 i 限制 为 1, 从 而 把 7 限定 为 100。 在 空间 1 和 3 中 对 p 的 赋值 显然 是 死 代 码 , 因此 可 以 被 消除 。 

下 面 我 们 在 空间 2 中 分 割 下 标 为 i 的 循环 。 循环 下 标 i 的 第 一 次 和 最 后 一 次 迭代 是 不 同 的 。 
因此 , 我 们 把 这 个 循环 分 割 为 三 个 子 空间 : 
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1) max(1,p+1) <i<p+2, HPRA sz 被 执行 。 

2) max(1,p +2) <i<min(100,100 +p), 其 中 si Ml sz 都 被 执行 。 

3) 101 +p <i<min(101 +p,100), 其 中 只 有 si 被 执行 。 

图 11-33 中 第 二 个 空间 的 循环 谨 套 因此 可 以 被 写成 图 11-34a 所 示 的 代码 。 

图 11-34b 显示 了 经 过 优化 的 程序 。 我 们 已 经 用 图 11-34a 替换 了 图 11-33 中 相应 的 循环 迭代 
结构 。 我 们 也 已 经 把 对 pi 和 j 的 赋值 传播 到 数组 访问 中 。 当 在 中 间 代 码 层次 上 进行 优化 时 , 其 
中 的 一 些 赋值 会 被 识别 为 公共 子 表达 式 , 并 从 数组 访问 代码 中 重新 抽取 出 来 。 m 

/* 空间 (1) */ 


-100; 
1; 


j 100; 
Xi, je) 以 本 人 ih 


/* 空间 (2) */ 
for (p = -99; p <= 98; p++) 
for (i = max(1,pt1); i <= min(100,101+p); i++) 
for (j = max(1,i-p-1); j <= min(100,i-p); j++) { 
if (p == i-j-1) 
Klisi] sh jdt Viet ids 4 Cet) A 
if (p == i-j) 
Yli, = XTi, j- + Yli,jl; /* (820047 
$ 


/* 空间 (3) */ 

P = 99; 

i = 100; 

eds 

VE = X(i,j-1] + Yli, jl: /* (82) *#/ 





图 11-33 RE p 的 值 分 割 迭 代 空 间 


/* 空间 (2) */ 
for (p = -99; p <= 98; p++) { 
/* 空间 (2a) */ 
if (p. 25.0). 4 
i = pti; 
J ds 
Yli, j] = Xii, j-i] + Y[i,j]; /* (s2) */ 


} 
/* 空间 (2b) */ 
for (i = max(1,p+2); i <= min(100,100+p); i++) { 
j = i-p-1; 
Xii j] = klij] + Yl a/s OA 
j = i-p; 
YGS a > xj- H YE, 3]; /* (S32) e/ 
} 
/* 空间 (2c) */ 


3 


j $ 
Xij] =) X(i,j) 4 ¥Li-15 5); /* (s4) */ 





a) 根据 ;的 值 分 割 空间 (2) 
图 11-34 例 11.48 的 代码 
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/* 空间 (4);-p = 100 */ 
XxX[1,100] = X[1,100] + Y[0,100]; 


/* 空间 (2) */ 
for (p = -99; p <= 98; p++) { 
if (p >= 0) 
Y[p+1,1] = X[p+1,0] + Y[p+1,1]; 
for (i = max(1,p+2); i <= min(100,100+p); i++) { 
X[i,i-p-1] = X(i,i-p-1] + Y[i-1,i-pr1]; 
yli i-p] = X(i,i-p-1] + Y{i,i-pl; 
F 
if (p <= -1) 
X[101+p,100] = X[101+p,100] + Y[101+p-1,100]; 


} 
/* 空间 (3); p = 99 */ 
Y[100,1] = X[100,0] + Y[100,1]; 





b) 和 图 11-28 等 价 的 优化 代码 


图 11-34 一 ( 续 ) 


11.7.8 源 代码 转换 

我 们 已 经 看 到 如 何 根据 各 个 语句 的 简单 仿 射 分 划 得 到 和 原来 的 源 代码 明显 不 同 的 程序 。 但 
是 ， 至 今 为 止 看 到 的 例子 中 都 没有 明确 显示 出 仿 射 分 划 是 如 何 与 源 代码 层次 上 的 改变 联系 起 来 
的 。 本 节 将 说 明 , 通过 把 仿 射 变换 分 解 成 为 一 系列 基本 变换 ， 我 们 可 以 相对 容易 地 论证 对 源 代码 
的 修改 。 

七 个 基本 仿 射 转换 

每 个 仿 射 分 划 可 以 表示 为 一 个 由 的 基本 仿 射 转换 组 成 的 序列 。 每 个 基本 仿 射 转换 对 应 于 源 
代码 层次 上 的 一 个 简单 改变 。 总 共有 七 个 基本 仿 射 转换 : 前 四 个 基本 转换 在 图 11-35 中 说 明 , 后 
三 个 转换 被 称 为 么 模 转 换 (unimodular transform) ,在 图 11-36 中 解释 。 

图 中 给 出 了 每 个 基本 转换 的 一 个 例子 : 一 个 源 代码 、 一 个 仿 射 分 划 和 一 个 结果 代码 。 我 们 也 
画 出 了 转换 之 前 和 之 后 的 代码 中 的 数据 依赖 关系 。 在 数据 依赖 关系 图 中 , 我 们 看 到 每 个 基本 转 
换 对 应 于 一 个 简单 的 几何 转换 ， 对 应 于 一 个 简单 的 代码 转换 。 这 七 个 基本 转换 为 : 

1) 融合 (fusion) 。 融合 转换 的 特点 是 把 原 程序 中 的 多 个 循环 下 标 映射 到 同一 个 循环 下 标 上 。 
新 的 循环 融合 了 来 自 不 同 循环 的 语句 。 

2) 裂变 (fission) 。 裂 变 转 换 是 融合 的 逆向 转换 。 它 把 不 同 语句 的 同一 个 循环 下 标 映 射 到 转 
换 得 到 的 代码 中 的 不 同 循环 下 标 。 这 个 转换 把 原来 的 一 个 循环 分 解 为 多 个 循环 。 

3) 重新 索引 (re-indexing) o 重新 索引 技术 把 一 个 语句 的 动态 执行 偏 移 固定 多 个 迁 代 。 这 个 
仿 射 变 换 有 一 个 常量 项 。 

4) 比例 变换 (scaling) 。 源 程序 中 的 连续 迭代 被 一 个 常量 因子 隔 开 。 这 个 仿 射 变换 具有 一 个 
正 的 非 单元 系数 。 

5) 反 置 (reversal)。 按 照相 反 顺 序 执行 循环 中 的 迭代 。 反 置 转换 的 特点 是 有 一 个 系数 为 - 1。 

6) 交换 (permutation) 。 交 换 内 层 循 环 和 外 层 循环 。 这 个 仿 射 变 换 由 单位 矩阵 中 的 经 过 交换 
的 各 行 组 成 。 

7) 倾斜 (skewing) 。 沿 着 一 个 角度 来 遍历 循环 的 迭代 空间 。 这 个 仿 射 变换 是 一 个 么 模 矩 阵 ， 
其 对 角 线 上 都 是 1。 
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‘a Ta) | 转换 后 的 代码 
for (i=1; i<=N; i++) for (p=1; p<=N; p++){ 














Y[i] = Z[i]; /*s1*/ Y[p] = Z[p]; 
for (j=1; j<=N; j++) 融合 X[p] = Y[p]l; 
X[j] = Y[j]; /*s2*/ si:p=i } 
G00 OO Qa 52:p=j 可 OOOO s 
4 u 2 5 RETETA 9 6 i 32 


= 





for (i=1; i<=N; i++) 


{erckpr ls, por pt YL] = 2Z[i]; /*s1*/ 











Y[p] = Z[p]; : 
5 i IAE for (j=1; j<=N; j++) 
: X[p] = Y[p]; os Xj] = Y[j]; /*s2*/ 
O DRO G Í Sy $2:J =p S) s1 
Lil 
ð © T Å : i a 
P (N>=1) X[1]=Y[0]; 
for (i=1; i<=N; i++) { for (p=1; p<=N-1; pt+){ 
Y[i] = Zli]; /*s1*/ Y[p]=Z[p]; 
x[i] = Y[i-1]; /*s2*/ 重新 索引 X[p+1]=Y[p]; 
: Sipsi 
ITTA Orai lanp s i~t hit 0D Dz; 
i URR S CO oO OG si 
a's ees a keppi 
tS lt A @ a 





for (p=1; p<=2*N; p++){ 
if (p mod 2 == 0) 
Y[p] = Z[p]; 
X[p] = Y[p]; 
} 


for (4=1; i<=N; i++) 


Y[2*i] = Z[2*i]; /*s1*/ 
for (j=1; j<=2*N; j++) š 
Terai: bende 比例 变换 





a p= Dri 
28 & sı (s2: p= 3) yD ER ols 


图 11-35 基本 仿 射 转换 ( I) 


























么 模 转 换 
一 个 么 模 转换 仅 由 一 个 么 模 系数 矩阵 组 成 , 没有 常量 向 量 。 人 么 模 答 阵 是 一 个 正方 形 矩 阵 ， 
其 行列 式 为 +1。 么 模 转 换 的 重要 性 在 于 它 把 一 个 维 迭 代 空间 映射 到 另 一 个 n 维 的 多 面体 ， 
并 且 两 个 空间 之 间 的 迭代 具有 一 一 对 应 关系 。 





并 行 化 的 几何 解释 

在 上 面 的 例子 中 , 除 裂 变 之 外 , 其 他 的 仿 射 转换 都 是 通过 把 无 同步 仿 射 分 划算 法 应 用 到 各 自 
的 源 代 码 上 而 得 到 的 。( 下 一 节 中 将 讨论 如 何 把 裂变 转换 应 用 于 带 有 同步 的 代码 的 并 行 化 。) 在 每 
一 个 例子 中 , 生成 的 代码 有 一 个 (最 外 层 的 ) 可 并 行 化 循环 , 这 个 循环 的 各 个 迭代 可 以 分 配给 不 
同 的 处 理 器 , 并 且 不 需要 同步 。 
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l 源 代码 “oad 
for (i=0; i<=N; i++) dne OAN 
Y(N-i] = Zli]; /*s1*/ oe 
for (j=0; j<=N; j++) : 
二 RE Xip] = Y[p]; 
MIRATA MEMA | eet 9 
g2 00 Ds (s2:p= i) O ii si 
id $ j s2 
A DN 
for (p=0; p<=M; ptt) 
for (q=1; q<=N; q++) 
ZIą,pl]= Zlq-1,p]; 
Aia [qp] [q-1,p 


ZE = 











for (i=1; i<=N+M-1; i++) 
for (j=max(1,i+N); 
j<=min(i,M); j++) 


PA at Ue oat I 














二 


for (p=1; p<=N; p++) 
for (q=1; q<=M; q++) 
Z[p,q-p] = 
Z [p-1 »97P- ij; 


QQ 
OD 
Gre 








这 些 例子 说 明 可 以 使 用 几何 学 的 方法 来 简单 地 解释 并 行 化 技术 是 如 何 工作 的 。 依 赖 边 总 是 
从 一 个 较 早 的 实例 指向 较 晚 的 实例 。 因 此 , 嵌 套 在 不 同 循环 中 的 不 同 语句 之 间 的 依赖 关系 遵循 
程序 文本 中 的 顺序 ; 嵌 套 在 同一 循环 中 的 语句 之 间 的 依赖 关系 遵循 词典 顺序 。 从 几何 学 角度 讲 ， 
一 个 二 维 循环 召 套 结构 的 依赖 关系 总 是 在 [0° ,180°) 的 范围 之 内 , 也 就 是 说 这 些 依赖 关系 的 角度 


图 11-36 基本 仿 射 转换 ( I[[) 


必然 低 于 180°, 但 是 不 小 于 0°。 


仿 射 转换 改变 了 迭代 的 顺序 , 使 得 只 有 最 外 层 循环 的 同一 迭代 之 内 的 运算 之 间 才 有 依赖 关 
系 。 换 句 话说 , 在 最 外 层 循环 的 迭代 边界 上 没有 依赖 边 。 在 对 简单 的 源 代码 进行 并 行 化 时 , 我们 


可 以 画 出 它们 的 依赖 关系 , 并 用 几何 方法 找 出 这 样 的 转换 。 


11.7.9 11.7 节 的 练习 


练习 11. 7. 1: 对 于 下 面 的 循环 


for (i = 2; i < 100; i++) 


A[i] = A[i-2]; 


1) 最 多 可 以 用 多 少 个 处 理 器 来 有 效 运行 这 个 循环 ? 
2) 以 处 理 器 编号 p 作为 参数 改写 这 个 代码 。 
3) 给 出 这 个 循环 的 空间 分 划 约 束 , 并 找 出 这 个 约束 的 一 个 解 。 
4) 这 个 循环 的 具有 最 高 秩 的 仿 射 分 划 是 什么 ? 
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练习 11.7.2: 对 于 图 11-37 PH EAREB BAY 11.7.1, 


for (i = 1; i <= 400; 448) 
for (j = 1; j <= 100; j++) 
for (k = 4; k <= 100; k++). { 
ALs k] = ALi, j,k) + BLi-1,j,k]; 
Bli,j,k] = Bli,j,k] + Cli,j-1,k]; 
Cli,jskl = Chi, j,k] + Ali, j,k-1]; 


} 


for (i = 1; i <= 100; i++) 
for (j = 41; j <= 100; j++) 
for (k = 1; k <= 100; k++) { 
Alij, k] = Ali j,k] + BLi-1,5,%); 
Bli jkl s Blisj:k] + ALi, j-1;RI; 
CENS CL dl k ALi jki] + Bla, 75K) 
$ 





c) 
图 11-37 练习 11.7.2 的 代码 
练习 11. 7. 3: 改写 下 面 的 代码 


for (i = 0; i < 100; i++) 
A[i] = 2*A[i]; 

for (j = 0; j < 100; j++) 
ALj] = ACj] + 4; 


使 得 新 代码 只 包含 一 个 循环 。 以 处 理 器 编号 pb 为 下 标 改 写 这 个 循环 , 使 得 代码 可 以 在 100 个 处 理 
器 之 间 分 配 , 其 中 第 p 个 迭代 由 处 理 器 p 执行 。 
练习 11.7.4: 在 下 面 的 代码 中 


for (i = 1; i < 100; i++) 
for (j = 1; j < 100; j++) 
/* (s) */ Ali, j] =(ALi-1,j] +iAli+1,j] + ALi,j-1] + Ali, j+1])/4; 


ME— KI AR EEA ARE TIETE s 必须 首先 执行 迭代 s(i - 1,7) Al s(i,j-1), 
然后 执行 迭代 s(i,j) 。 证 明 这 些 约束 就 是 全 部 的 必要 约束 。 然 后 改写 代码 使 得 最 外 层 循环 的 下 
标 变 量 为 p, 并 且 所 有 满足 i+j=p 的 实例 s(i,j) 都 在 外 层 循 环 的 第 bp 个 迄 代 上 执行 。 

练习 11. 7. 5: 重复 练习 11.7.4, 但 是 重新 安排 执行 方案 , 使 得 s 的 满足 i -j=p 的 实例 在 外 
层 循 环 的 第 p 个 迭代 上 运行 。 

! 练习 11.7.6: 把 下 面 的 循环 


for (i = 0; i < 100; i++) 


ALi] = Bil; 
for (j = 98; j >= 0; j = j-2) 
Bi] = i; 


合并 为 一 个 循环 , 要 求 保持 所 有 的 依赖 关系 。 
练习 11. 7.7: 证 明和 矩阵 
21 
[i al 


EAB . HIB— FEM —T ERRE YT ER 
练习 11.7.8: 对 下 面 的 矩阵 重复 练习 11.7.75 


pe 
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11.8 ”并 行 循 环 之 间 的 同步 


如 果 我 们 不 侈 许 处 理 器 之 间 进 行 任 何 同步 , 很 多 程序 就 没有 任何 并 行 性 。 但 是 通过 向 一 个 
程序 中 增加 少量 固定 多 个 同步 运算 之 后 , 可 以 找到 更 多 的 并 行 性 。 在 本 节 中 , 我 们 将 首先 讨论 因 
为 引入 固定 多 个 同步 运算 而 获得 的 并 行 性 。 下 一 节 中 将 讨论 一 般 情 况 , 即 把 同步 运算 嵌入 到 循 
环 中 的 情况 。 

11.8.1 ”固定 多 个 同步 运算 

没有 无 同步 并 行 性 的 程序 可 能 包含 一 系列 循环 。 如 果 独 立地 考虑 这 些 循环 , 其 中 的 某 些 循 
环 是 可 以 并 行 化 的 。 我 们 可 以 在 这 些 循环 执 行 之 前 和 之 后 引入 同步 栅 障 ,从 而 把 这 些 循环 并 行 
化 。 例 11. 49 说 明了 这 一 点 。 

图 11.38 给 出 了 一 个 实现 了 ADI( 交 圭 方 向 隐 式 方法 ,一 种 数值 计算 方法 ，Altemating 
Dirrection Implicit) 积分 算法 的 典型 程序 。 它 没 有 无 
同步 并 行 性 。 在 第 一 个 循环 谋 套 结构 中 的 依赖 关系 。| PO AD j 

要 求 每 个 处 理 器 在 数组 了 的 一 列 上 工作 ; 但 是 在 第 x[i,j] = £0004, j] + Xli-1,jD; 

一 个 人 循环 谨 套 结构 中 的 依赖 关系 要 求 每 个 处 理 器 在 | PE A aay 

数组 的 一 行 上 工作 。 如 果 要 求 没 有 通信 运算 , 整 KL ECX jt XL- 

个 数组 必须 放 在 同一 个 处 理 器 上 , 因此 不 存在 并 行 

k BE RII ER Te 1E oes 
化 的 。 

并 行 化 代码 的 方法 之 一 是 在 第 一 个 循环 中 让 不 同 的 处 理 器 在 数组 的 不 同 列 上 工作 , 同步 并 
等 待 所 有 的 处 理 器 完成 任务 后 , 各 个 处 理 器 再 在 各 个 行 上 进行 运算 。 使 用 这 个 方法 , 只 需要 引入 
一 个 同步 操作 就 可 以 使 算法 中 的 所 有 计算 都 被 并 行 化 。 但 是 , 我 们 注意 到 虽然 只 进行 了 一 次 同 
步 , 但 是 这 个 并 行 化 方案 要 求 几乎 所 有 的 矩阵 立 中 的 数据 在 不 同 的 处 理 器 之 间 传递 。 通 过 引入 
和 更 多 的 同步 计算 有 可 能 降低 通信 量 。 我 们 将 在 11.9.9 节 中 讨论 这 个 问题 。 口 

看 起 来 ,这 个 方法 可 能 只 适用 于 由 一 系列 循环 嵌 套 组 成 的 程序 。 但 是 ,我 们 可 以 通过 代码 转 
换 创造 出 更 多 的 优化 机 会 。 我 们 可 以 应 用 循环 裂变 转换 把 原 程序 中 的 循环 分 解 成 为 几 个 较 小 的 
循环。 利用 同步 栅 障 把 它们 隔 开 , 然后 逐一 将 它们 并 行 化 。 我 们 用 例 11. 50 来 解释 这 个 技术 。 
考虑 下 面 的 循环 : 


for (i=l; i<=n; i++) { 
FOI =) VE + Zips /* (s1) */ 
WIA[i]] = X[i]; /* (s2) */ 
} 


因为 不 知道 数组 4 中 的 值 , 我 们 必须 假设 语句 s 中 的 访问 可 以 写 到 丈 的 任何 元 素 上 。 因 此 ， 
Sy 的 实例 的 执行 顺序 必须 和 它们 在 原 程序 中 的 顺序 一 致 

代码 中 没有 无 同步 的 并 行 性 , 算法 11. 43 将 简 
单 地 艳 所 有 的 计算 任务 都 赋予 同一 个 处 到 器。 但 是 。 | Tee A acion baretan o “ 
至 少 语句 3i 的 实例 可 以 并 行 执行 。 我们 可 以 把 这 个 ”| at @ = o 
代码 的 一 部 分 并 行 化 , 方法 是 让 不 同 的 处 理 器 执行 i et ee EPI 
语句 si 的 不 同 实例 。 然 后 在 另 一 个 独立 的 顺序 循环 
中 , 用 一 个 处 理 器 ( 比如 说 0 号 处 理 器 ) 执行 >。 相 图 11-39 例 11.50 中 的 循环 的 SPMD 代码 ， 
应 的 SPMD 代码 显示 在 图 11-39 中 。 m 其 中 p 是 存放 处 理 器 ID 的 变量 
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11. 8.2 程序 依赖 图 


为 了 找 出 所 有 可 以 通过 加 入 固定 多 个 同步 运算 而 变 得 可 用 的 并 行 性 , 我 们 可 以 尽 可 能 地 对 
原 程序 应 用 裂变 转换 。 把 循环 尽 可 能 分 解 为 独立 循环 , 然后 独立 地 并 行 化 每 个 循环 。 

为 了 揭示 出 所 有 可 以 进行 循环 裂变 的 机 会 ， 我 们 使 用 程序 依赖 图 (Program Dependence 
Graph, PDG) 的 抽象 表示 方法 。 程 序 的 程序 依赖 图 中 的 各 个 结 点 是 程序 的 赋值 语句 , 图 中 的 边 表 
示 语 句 之 间 的 数据 依赖 关系 以 及 依赖 的 方向 。 只 要 语句 si 的 某 个 动态 实例 和 后 面 的 语句 sz 的 一 
个 动态 实例 之 间 存 在 数据 依赖 关系 ,就 存在 一 条 从 语句 s1 到 语句 so 的 边 。 

构造 一 个 程序 的 PDG 时 , 我 们 首先 找 出 每 一 对 语句 中 的 两 个 静态 访问 之 间 的 数据 依赖 关 
系 。 一 个 语句 对 中 的 两 个 语句 可 以 相同 ,这 两 个 静态 访问 也 可 以 相同 。 假 设 确定 了 语句 si 中 
的 访问 A 和 语句 s 中 的 访问 A 之 间 有 依赖 关系 。 请 注意 , 一 个 语句 的 实例 可 以 使 用 下 标 向 
Hi=[i,,%,-°,1, KAM, HP i, 是 该 语句 所 在 循环 络 套 结构 中 从 最 外 层 开始 的 第 个 循环 
的 下 标 。 

1) 如 果 有 两 个 语句 实例 , si Mi, As, HEH, 它们 之 间 具 有 数据 依赖 关系 , FHE 
原 程 序 中 , i, 在 i, 之 前 执行 ， 记 作 i, sis 12 3 那么 有 一 条 从 31 到 S2 的 边 。 

2) 类 似 地 , 如 果 有 两 个 语句 实例 , sı 的 实例 二 Ms 的 实例 i , 它们 之 间 具 有 数据 依赖 关系 ， 
WHE i, < ， 那 么 有 一 条 从 s2 到 si 的 边 。 

请 注意 , 有 可 能 根据 两 个 语句 si As. 之 间 的 数据 依赖 关系 , 在 PDC 中 既 生 成 了 从 s1 到 s2 
的 边 , 又 生成 了 从 ss Bs, 的 边 。 

在 语句 sı All so 相同 的 特殊 情况 下 ， i, <5, 5,12 XHA i <i, (Bf i, 按照 词典 排序 比 i, NN) o 
在 一 般 情况 下 , s1 和 s, 可 以 是 不 同 的 语句 ,， AAT RER TA A RESETS o 
对 于 例 11. 50 中 的 程序 ,在 语句 s 的 实例 之 间 没 有 依赖 关系 。 但 是 , 语句 s 的 第 i 
个 实例 必须 在 语句 si 的 第 i 个 实例 之 后 发 生 。 更 糟糕 的 是 , 因为 数组 引 


用 了 [4[i] 可 以 对 数组 的 WW 的 每 个 元 素 进行 写 运算 , s 的 第 i 个 实例 局 
依 冲 于 所 有 之 前 的 的 实例 。 也 就 是 说 , 语句 s2 依赖 于 它 本 身 。 例 (aa ) oy 
11. 50 的 程序 的 PDG 显示 在 图 11-40 中 。 请 注意 图 中 有 一 个 只 包含 s 


图 11-40 fi) 11. 50 14) 
的 环 。 口 程序 的 PDG 
程序 依赖 图 使 得 我 们 可 以 很 容易 地 确定 是 否 可 以 分 割 一 个 循环 中 


的 多 个 语句 。 在 一 个 PDG 中 , 一 个 环 所 连接 的 各 个 语句 不 能 被 分 割 开 。 如 果 si 一 sz 是 一 个 环 中 
两 个 语句 之 间 的 依赖 关系 , 那么 s1 的 某 些 实例 必须 在 s 的 某 些 实例 之 后 发 生 , 反 过 来 也 成 立 。 
请 注意 , 只 有 当 s, Als, 嵌入 在 同一 个 循环 中 的 时 候 才 可 能 有 这 种 相互 依赖 关系 。 因 为 有 这 种 相 
ERMAR, 我 们 不 能 先 执行 完 一 个 语句 的 所 有 实例 之 后 再 执行 另 一 个 语句 的 所 有 实例 , 因此 不 
允许 进行 循环 裂变 转换 。 另 一 方面 , 如 果 依赖 关系 s>s 是 单 向 的 , 我们 就 可 以 对 这 个 循环 进行 
分 割 ,首先 执行 s 的 所 有 实例 , 然后 执行 ss 的 实例 。 
DIEA 图 11-41b 显示 了 图 11-41a 中 程序 的 程序 依赖 图 。 图 中 语句 si 和 ss 属于 一 个 环 , A 
此 不 能 被 放 到 不 同 的 循环 中 去 。 但 是 我 们 可 以 把 语句 5 分割 出 去 , 并 在 执行 其 他 计算 之 前 执行 
它 的 所 有 实例 , 如 图 11-42 所 示 。 第 一 个 循环 是 可 以 并 行 化 的 , 但 是 第 二 个 循环 不 能 被 并 行 化 。 
我 们 可 以 在 第 一 个 循环 的 并 行 执行 之 前 和 之 后 放 上 一 个 同步 栅 障 , 从 而 把 第 一 个 循环 并 行 化 。 
CO 
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for (i = 0i < mano 
Z[i] = Z[i] / WL[i]; /* (s1) */ 
for Cj snd “ns jt 
Xi =-V YE pda /say kA 


Zig) = Ai ZLI /* (83) */ 











a) 一 个 程序 b) 它 的 依赖 图 


E 11-41 例 11;5.2 的 程序 和 依赖 图 


for(i Oe i ng te) 
for (j = i; j <n} J++) 
X(i,j] = Yli,j]*¥0i,j];~ /* (s2) */ 
for) (i =O; 4 < ny i++), { 


Z[i = Z[il / wil; /* (s1) */ 
for Gais < ny je) 
Z[j = Z[j] + X[i,j]; /* (s3) */ 





图 11-42 = xX$—- MB REA A EI A ET 


11.8.3 ”层次 结构 化 的 时 间 
在 一 般 情况 下 , 关系 <,,;, 的 计算 是 很 困难 的 。 但 是 对 于 某 些 类 型 的 程序 而 言 , 我 们 有 一 个 直 
接 的 方法 来 计算 这 种 依赖 关系 。 本 节 中 的 优化 技术 经 常 被 应 用 于 这 一 类 程序 。 假 设 这 个 程序 是 
块 结构 的 , 由 循环 和 简单 的 算术 运算 组 成 , 并 且 不 包含 其 他 控制 结构 。 该 程序 中 的 语句 要 么 是 一 
个 赋值 语句 ;要么 是 一 个 语 名 序列， 要 么 是 一 个 其 循环 体 为 单个 语句 的 循环 结构 。 这 样 ,这 个 程 
序 的 控制 结构 就 形成 了 一 个 层次 结构 。 这 个 层次 结构 的 顶层 结 点 表示 对 应 于 整个 程序 的 语句 。 
单个 赋值 语句 是 一 个 叶子 结 点 。 如 果 某 语句 是 一 个 语句 序列 , 那么 它 的 子 结 点 就 是 该 序列 中 的 
语句 。 这 些 子 结 点 按照 语句 的 词典 排序 从 左 到 右 排列 。 如 果 某 语句 是 一 个 循环 结构 , 那么 它 的 
子 结 点 就 是 循环 体 对 应 的 子 图 , 通常 是 由 一 个 或 多 个 语句 组 成 的 序列 。 
DHEA 图 11-43 中 程序 的 层次 结构 显示 在 图 11-44 中 。 执 行 序列 的 层次 结构 特性 在 图 11- 45 
中 着 重 显示 。 语 句 so 的 唯一 实例 在 所 有 其 他 运算 之 前 









进行 ,因为 它 是 被 执行 的 第 一 个 语 杀 < EFR, RIR IT we Geo; yi 

行 来 自 外 层 循 环 的 第 一 个 迭代 的 所 有 指令 , 然后 再 执行 sl; 

第 二 个 迭代 中 的 指令 , 这 样 一 直 向 前 执行 。 对 于 循环 下 i ee ea 
标 i 的 值 为 0 的 所 有 动态 实例 ; A sı, La L Al ss HE t 

照 正 文 顺序 执行 。 我 们 可 以 重复 上 面 的 讨论 , 生成 执行 py ee) 
顺序 的 其 他 部 分 。 口 s4; 





s5; 






我 们 可 以 用 一 种 层次 结构 化 的 方式 来 解决 由 两 个 
不 同 语句 生成 的 两 个 实例 之 间 的 顺序 问题 。 如 果 两 个 
语句 处 于 同一 个 循环 中 , 我 们 从 最 外 层 循环 开始 比较 它 。” 图 11-43 一 个 按 层次 结构 组 织 的 程序 
们 的 共同 循环 的 下 标 变 量 的 值 。 当 我 们 发 现 它们 的 某 个 下 标 具 有 不 同 值 时 , 这 个 差 值 就 决定 了 
它们 之 间 的 顺序 。 只 有 当 较 外 层 循环 的 下 标 值 都 相同 的 时 候 , 我 们 才 需 要 比较 下 一 个 内 层 循 环 
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的 下 标 值 。 这 个 过 程 类 似 于 我 们 比较 以 小 时 /分 钟 / 秒 的 方式 所 表示 的 时 间 。 比较 两 个 时 间 时 ， 
我 们 首先 比较 小 时 数 ， 只 有 当 它 们 的 小 时 数 相同 的 时 候 , 我 们 才 比较 分 钟 ， 以 

此 类 推 。 如 果 所 有 公共 循环 的 下 标 值 都 相同 ,那么 我 们 根据 它 
们 的 相对 正文 位 置 来 决定 它们 之 间 的 顺序 。 因 此 , 我 们 一 直 在 OR 
HEKO LH EOE RPP ATT ME EE BE DN JR A s LI 


化 "的 时 间 。 Pata Su 
令 si H-/MRETRED di 的 循环 中 的 语句 , 而 so KE y | 

在 深度 为 d, 的 循环 中 , 它们 之 间 有 d 个 公共 (外 层 ) 循环 。 当 s2 33 s4 

%d<d, Hd<d),. 假设 站 = [i i, ia JA; 的 一 个 实例 ， 图 11-44 例 11.53 中 的 程序 

而 j= Li jo." Fa, 1A s2 的 一 个 实例 。 的 层次 结构 


ixa 当 且 仅 当 下 列 条 件 之 一 成 并 : 

1) lisi tig | <[ji j2" ub Sb 或 者 

2) liisis] = Li desi], BEERE s HR s 
之 前 。 

WA Li , 记 ,…ig] <[ 放 ,jp，…ja] 可 以 写成 如 下 的 线性 不 等 
式 的 析 取 式 。 

(i, <j) V Cy =j Aiz <j) V =V 

(i, =f) Aves Nia =Ja-1 Nba <Ja) 

只 要 数据 依赖 关系 的 条 件 和 上 面 的 析 取 式 中 的 某 个 子 句 同 
时 成 立 ; 就 存在 一 个 从 sı 到 的 PDG 边 。 因 此 , 我 们 可 能 需 
要 求解 多 达 d 或 4+1 个 整数 线性 规划 问题 来 决定 某 一 条 边 是 
否 存 在 。 要 求解 的 问题 个 数 依赖 于 语句 si 是 否 按 照 正 文 顺 序 ”图 11-45 例 11.53 中 的 程序 
出 现在 sy 之 前 。 的 执行 顺序 
11.8.4 并行 化 算法 

现在 我 们 给 出 一 个 简单 的 并 行 化 算法 。 它 首先 把 计算 任务 分 解 到 尽 可 能 多 的 不 同 循环 中 ， 
然后 独立 地 并 行 化 各 个 循环 。 
在 允许 0(1) 次 同步 的 情况 下 最 大 化 并 行 性 的 度数 。 

输入 : 一 个 带 有 数组 访问 的 程序 。 

输出 : 带 有 固定 多 个 同步 栅 障 的 SPMD 代码 。 

方法 : 

1) 构造 程序 的 程序 依赖 图 , 并 把 语句 分 划 为 强 连通 分 量 (SCC) 。 回 忆 一 下 10.5.8 节 介绍 
过 , 一 个 强 连 通 分 量 是 原 图 的 一 个 满足 下 列 条 件 的 最 大 的 分 量 : 其 中 的 每 个 结 点 都 可 以 到 达 所 有 
其 他 结 点 。 

2) 转换 代码 ; 使 之 按照 拓扑 顺序 执行 各 个 SCC。 必 要 时 可 以 应 用 裂变 转换 。 

3) 对 每 个 SCC 应 用 算法 11.43, 寻找 出 所 有 的 无 同步 并 行 性 。 在 每 个 被 并 行 化 的 SCC 的 前 
后 都 插入 同步 栅 障 。 O 

虽然 算法 11.54 能 够 找到 带 有 0(1) 次 同步 的 所 有 并 行 性 度数 , 它 仍 然 存在 一 些 缺 点 。 第 一 ， 
它 可 能 引入 不 必要 的 同步 。 作 为 一 个 现实 问题 , 如 果 我 们 把 这 个 算法 应 用 到 一 个 可 以 被 无 同步 
地 并 行 化 的 程序 上 , 这 个 算法 会 对 每 个 语句 进行 并 行 化 , 并 且 在 执行 各 个 语句 的 并 行 循环 之 间 引 
入 同步 栅 障 。 第 二 , 虽然 只 会 有 固定 多 个 同步 , 但 得 到 的 并 行 化 方案 会 在 每 次 同步 的 时 候 在 不 同 
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的 处 理 器 之 间 传递 很 多 数据 。 有些 情 况 下 , 通信 开销 会 使 得 并 行 化 的 代价 太 过 昂贵 , 有 时 甚至 不 
如 在 三 个 单 处 理 器 上 顺序 执行 这 个 程序 。 在 后 面 的 各 节 中 , 我 们 将 继续 给 出 提高 数据 局 部 性 的 
手段 ， 从 而 降低 通信 量 。 
11.8.5 11.8 节 的 练习 

练习 11. 8. 1: 把 算法 11. 54 应 用 到 图 11-46 的 代码 上 。 


for (i=0; i<100; i++) 
ACil] = ALi] + Xli]; /* (s1) */ 
for (i=0; i<100; i++) 


for (j=0; j<100; j++) 
BLi,j] = YCi,j] + ALi] + AiG]; /* (82) */ 





图 11-46 练习 11.8.1 的 代码 


练习 11. 8. 2: 把 算法 11. 54 应 用 到 图 11-47 的 代码 上 。 
练习 11. 8. 3: 把 算法 11. 54 应 用 到 图 11-48 的 代码 上 。 















for (i=0; i<100; i++) 
Afi] = Ali] + XL); /* (af) ¥/ 

for (i=0; i<100; i++) { 

for (j=0; j<100; j++) 
BOL = ALi] + YCj]; Z= (s2) #7 


for (i=0; i<100; i++) 

Alil = ALi]s+ XLi] /* Ce), */ 
for (i=0; i<100; i++) { 

B[i] = BLi] + ALi]; /* (s2) */ Chil = Bla] + Ziil: t/t G3) */ 
for (j=0; j<100; j++) 

Dli j] = ALi] + BIj]; /* (s4) */ 


for (j=0; j<100; j++) 
CHI = YLT] + BEJI; 7* Cs3)> */ 





图 11-47 练习 11.8.2 的 代码 图 11-48 练习 11.8.3 的 代码 


11.9 ”流水线 化 技术 


在 流水 线 化 技术 中 , 一 个 任务 被 分 成 数 个 阶段 , 各 个 阶段 在 不 同 的 处 理 器 上 进行 比如 , 一 
个 具有 nn 个 迭代 的 循环 可 以 被 构造 一 个 n 阶段 的 流水 线 。 每 个 阶段 被 分 配给 不 同 的 处 理 器 , 当 一 
个 处 理 器 完成 了 它 负责 的 阶段 后 ， 结 果 就 作为 输入 传送 到 流水 线 中 的 下 一 个 处 理 器 。 

下 面 我 们 首先 更 加 详细 地 解释 流水 线 化 的 概念 。 然 后 我 们 在 11. 9. 2 节 中 给 出 了 一 个 实际 生 
活 中 的 被 称 为 “连续 过 松弛 方法 ”的 数值 算法 。 我 们 用 这 个 例子 说 明 在 什么 样 的 情况 下 可 以 应 用 
流水 线 化 技术 。 然 后 我 们 在 11. 9. 6 节 中 正式 定义 需要 求解 的 约束 , 并 在 11. 9.7 节 中 描述 一 个 求 
解 这 些 问题 的 算法 。 如 果 一 个 程序 的 时 间 分 划 约 束 具 有 多 个 独立 解 , 那么 就 可 以 认为 它 具 有 最 
外 层 的 完全 可 交换 循环 (fully permutable loop) 。 正 如 11. 9. 8 节 中 将 讨论 的 , 这样 的 循环 可 以 很 容 
易 地 被 流水 线 化 。 
11.9.1 什么 是 流水 线 化 

前 面 我 们 尝试 对 一 个 循环 嵌 套 结构 进行 并 行 化 时 , 我 们 对 这 个 循环 嵌 套 结构 中 的 迭代 进行 
分 划 , 使 得 任意 两 个 共享 数据 的 迭代 都 被 分 配给 同一 个 处 理 器 上 。 流 水 线 化 技术 允许 不 同 处 理 
器 共享 数据 , 但 是 一 般 只 能 以 “局 部 的 ”方式 来 共享 数据 , 数据 只 能 从 一 个 处 理 器 传递 到 所 在 处 
理 器 空间 中 的 邻近 处 理 器 上 。 下 面 给 出 一 个 简单 的 例子 。 


考虑 循环 : 


for (i = 1; i <= m; i++) 
for G = 1 =n; 5+) 
X= XL Via): 
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MUSE Y 8 TP, 并 把 结果 加 到 XX 的 第 个 元 素 上 。 其 中 的 内 层 循环 对 应 
于 求 和 过 程 。 因 为 数据 依赖 的 原因 ,， 这 个 循环 必须 顺序 执行 9, 但 是 不 同 的 求 和 过 程 之 间 是 独立 
的 。 我 们 可 以 让 每 个 处 理 器 执行 一 个 独立 的 求 和 过 程 ,从 而 实现 代码 的 并 行 化 。 处 理 器 i 访问 了 
的 第 i 行 并 修改 X 的 第 i 个 元 素 。 

我 们 还 可 以 把 多 个 处 理 器 组 织 成 一 个 流水 线 来 执行 这 个 求 和 过 程 ， FRR ALY BS 
来 获取 并 行 性 ， 如 图 11-49 所 示 。 更 明确 地 
讲 , 内 层 循环 的 每 个 迭代 都 可 以 被 当 作 流 水 
线 的 一 个 阶段 : 第 7 个 阶段 获取 在 前 一 阶段 
生成 的 互 的 一 个 元 素 , 将 它 和 了 的 一 个 元 素 
相 加 , 并 把 结果 传递 到 下 一 个 阶段 。 请 注意 
在 这 种 情况 下 , 每 个 处 理 器 访问 了 的 一 列 ， 
而 不 是 一 行 。 如 果 了 是 按 列 存放 的 , 那么 通 D 
过 按 列 分 划 ( 而 不 是 按 行 分 划 ) 就 可 以 提高 局 图 11-49 例 11.55 中 的 流水 线 化 的 执行 过 程 ， 

部 性 。 其 中 m=4, n=3 
第 一 个 处 理 器 处 理 完 前 一 个 任务 的 第 一 个 阶段 之 后 , 我 们 就 可 以 立刻 启 动 一 个 新 的 任务 。 
流水 线 在 开始 时 是 空 的 , 只 有 第 一 个 处 理 器 在 执行 第 一 个 阶段 。 在 它 完成 处 理 之 后 , 结果 被 传送 
到 第 二 个 处 理 器 ,同时 第 一 个 处 理 器 开始 处 理 第 二 个 任务 , 如 此 继续 ， 按照 这 种 方式 , 流水 线 被 
逐渐 填 满 ; 直到 所 有 的 处 理 器 都 进入 忙 状态 。 当 第 一 个 处 理 器 完成 了 最 后 一 个 任务 后 ,流水线 开 
始 排 空 , 越 来 越 多 的 处 理 器 进入 空闲 状态 ， 直到 最 后 一 个 处 理 器 完成 最 后 一 个 任务 。 在 稳定 状态 
下 ,nn 个 任务 在 由 个 处 理 器 组 成 的 流水 线 中 并 行 执行 。 口 
把 流水 线 技术 和 不 同 处 理 器 处 理 不 同 任务 的 简单 并 行 性 进行 比较 是 很 有 意思 的 : 
© 流水 线 化 技术 只 能 应 用 于 深度 至 少 为 2 HOGER SSE, 我 们 可 以 把 外 层 循 环 的 每 个 迭 
代 当 作 一 个 任务 ,而 把 内 层 循环 的 各 个 迭代 当 作 任 务 的 各 个 阶段 。 

。 在 一 个 流水 线 中 运行 的 任务 可 以 具有 数据 依赖 关系 。 属于 各 个 任务 的 同一 个 阶段 的 信息 
被 存放 在 同一 个 处 理 器 上 。 因 此 , 由 一 个 任务 的 第 ; 个 阶段 生成 的 结果 可 以 直接 被 后 继任 
务 的 第 i 个 阶段 使 用 , 不 会 产生 通信 开销 。 类 似 地 ， 由 不 同 任务 的 同一 个 阶段 所 使 用 的 每 
个 输入 数据 元 素 必须 存放 在 同一 个 处 理 器 内 , 如 例 11. 55 所 示 。 

© 如 果 任 务 是 独立 的 ， 那么 简单 的 并 行 化 方案 具有 较 好 的 处 理 器 利用 率 , 原因 是 各 个 处 理 
器 可 以 一 起 开始 执行 ， 而 不 会 产生 填 满 和 排 空 流水 线 的 开销 。 但 是 ， 如 例 11. 55 所 示 , 在 
一 个 流水 线 方案 中 的 数据 访问 模式 和 简单 并 行 化 方案 中 的 模式 不 同 。 如 果 流 水 线 化 技术 
可 以 降低 通信 量 , 那么 就 应 该 选择 这 个 技术 。 

11. 9.2 连续 过 松弛 方法 : 一 个 例子 

连续 过 松弛 法 (Successive Over Relaxation ,SOR) 是 一 个 在 使 用 松弛 方法 求解 联 立 线性 方程 式 
时 加 快 收敛 速度 的 技术 。 图 11-50a 中 显示 的 相对 简单 的 模板 解释 了 这 个 技术 的 数据 访问 模式 。 
在 这 里 , 数组 中 的 一 个 元 素 的 新 值 依赖 于 它 的 相 邻 元 素 的 值 。 这 个 运算 会 被 重复 执行 , 直到 满足 
某 种 收敛 标准 为 止 。 

图 11-50b 中 显示 的 是 关键 数据 依赖 关系 。 我 们 没有 显示 能 够 从 该 图 中 已 包含 的 依赖 关系 推 
导出 的 依赖 关系 。 比 如 , 迁 代 [站 依赖 于 和 迭代 [i,j -1] ,Li 一 2], 等 等 。 从 这 个 依赖 关系 可 以 清 
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X[1]+=Y[1,1] 
X[2]+=Y[2,1] 
X[3]+=Y[3;1] 
X[4]+=Y[4,1] 


X[1]+=Y[1,2] 
X[2]+=Y[2,2] 
X[3]+=Y[3,2] 
X[4]+=Y[4,2] 


X[1]+=Y[1,3] 
X[2]+=Y[2,3] 
X[3]+=Y [3,3] 
X[4]+=Y [4,3] 








O 请 记 住 , 我 们 没有 利用 加 法 的 交换 率 和 结合 率 。 
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楚 地 看 出 不 存在 无 同步 并 行 性 。 因 为 最 长 的 依赖 关系 链 包 含 了 0(m +n) Ti, 通过 引入 同步 ， 
我 们 应 该 可 以 找到 度数 为 1 的 并 行 性 , 并 在 0(m +n) 个 时 间 单 位 内 执行 0(mn) 运 算 。 


for = 03i <= m4+) 
for (j = 0; j <= n; 5+) 





xX[j+1] = 1/3 * (X[j] + X[j+1] + X[j+2]) 





a) 原来 的 源 代码 b) 代码 中 的 数据 依赖 关系 


图 11-50 ”连续 过 松弛 法 (SOR ) 的 例子 


特别 地 , 我 们 看 到 图 11-50b 中 角度 为 150° 昌 的 斜 线 上 的 各 个 迭代 之 间 没 有 数据 依赖 关系 。 
它们 只 依赖 于 比较 靠近 原点 的 斜 线 上 的 迭代。 因此 ， 我 们 可 以 从 原点 上 的 斜 线 开 始 逐 步 向 外 , 2 
条 斜 线 地 执行 线 上 的 迭代 ,从 而 达到 并 行 化 这 个 代码 的 目的 。 我 们 把 一 个 斜 线 上 的 全 部 迭代 称 
为 波 阵 面 (wave front) , 而 这 样 的 并 行 化 方案 被 称 为 波 阵 面 推进 (wavefronting) o 


11.9.3 ”完全 可 交换 循环 


我 们 首先 介绍 一 下 完全 可 交换 (full permutability ) 的 概念 * 这 个 概念 对 于 流水 线 化 和 其 他 一 
些 优化 技术 都 是 有 用 的 。 多 个 循环 是 完全 可 交换 的 条 件 是 它们 可 以 任意 地 排列 而 不 会 改变 原 程 
序 的 语义 。 一 旦 多 个 循环 具有 完全 可 交换 的 性 质 , 我 们 可 以 很 容易 地 把 相应 的 代码 流水 线 化 , 并 
对 代码 应 用 某 些 转换 ( 比如 分 块 技术 ) 来 提高 数据 局 部 性 。 

图 11-50a 中 给 出 的 SOR 代码 不 是 完全 可 交换 的 。 如 11. 7. 8 节 所 示 , 交换 两 个 循环 的 位 置 意 
味 着 原来 的 迭代 空间 中 的 迭代 按照 逐 列 ( 而 不 是 逐 行 ) 的 方式 执行 。 比 如 , 原来 在 迭代 [2,3] 中 的 
计算 将 会 在 兴 代 [1,4] 的 计算 之 前 执行 , 这 就 违反 了 图 11-50b 中 的 依赖 关系 。 

然而 , 我 们 可 以 通过 代码 转换 使 得 上 面 的 SOR 代码 变 成 完全 可 交换 的 。 对 这 个 代码 应 用 仿 
射 转换 

hh 

1a 
可 得 到 图 11-51a 中 所 示 代 码 。 经 过 转换 得 到 的 代码 是 完全 可 交换 的 , 交换 后 的 版 本 如 图 
11-510 所 示 。 我们 在 图 11-51b 和 图 11-51d 中 分 别 显示 了 这 两 个 程序 的 迭代 空间 和 数据 依赖 
关系 。 从 这 个 图 中 可 以 很 容易 看 出 这 个 重新 排序 保持 了 每 一 对 具有 数据 依赖 关系 的 访问 之 间 
的 相对 顺序 。 

当 我 们 交换 循环 时 , 我 们 极 大 地 改变 了 最 外 层 循环 的 各 个 迭代 所 执行 的 运算 集合 。 我 们 在 
调度 这 些 运算 时 具有 这 样 的 自由 度 , 说 明 在 对 程序 的 运算 进行 排序 时 有 很 大 的 回旋 余地 。 调 度 
的 余地 意味 着 存在 并 行 化 的 机 会 。 在 本 节 的 稍 后 我 们 将 说 明 如 果 一 个 循环 嵌 套 结构 具有 个 最 
外 层 的 完全 可 交换 循环 , 我 们 仅仅 需要 引入 0(n) 个 同步 运算 , 就 可 以 得 到 0(k 一 1) 度 的 并 行 性 
(n 是 一 个 循环 中 的 迭代 的 个 数 ) 。 





o 即 不 断 下 移 一 步 再 右 移 两 步 所 得 到 的 点 的 序列 。 
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for (i = 0; i <= m; i++) 
for (j = i; j <= itm; j++) 

X[j-it1] = 1/3 * (X£j-i] + X[j-it1] + X[j-i+2]) 

10 j 

a) 对 图 11-50 应 用 转换 [| , | 后 得 到 的 代码 b) 图 11-51a 中 的 代码 的 数据 依赖 关系 7 


j 


for (j = 0; j <= mtn; j++) 
for (i = max(0,j); i <= min(m, j), i++) 


X[j-iti] = 1/3 * (X[j-i] + X[j-iti] + X[j-i+2]) 





o) 图 11.51a 中 的 两 个 循环 的 一 个 重新 排列 A 图 11.51 中 代码 的 数据 依 环 关系 
图 11-51 图 11-50 中 代码 的 完全 可 交换 版 本 


11.9.4 ”把 完全 可 交换 循环 流水 线 化 
一 个 具有 上 个 最 外 层 完全 可 交换 循环 的 循环 在 套 结构 可 以 被 构造 为 一 个 0(k -1) 维 的 流水 
线 。 在 SOR 的 例子 中 , k=2, 因此 我 们 可 以 把 处 理 器 构造 成 一 个 线性 流水 线 。 
我 们 可 以 用 两 种 不 同 的 方法 对 上 
面 的 SOR 代码 进行 流水 线 化 , 如 图 [pomp cn 
2 BLS 所 大。 这 机 入水 | C 和 所 
线 化 方案 分 别 对 应 于 图 1151a 和 图 X{j-p+1] = 1/3 * (XLj-p] + XCj-pet] + XLj-pt21); 
11-510 所 示 的 两 种 可 能 的 排列 。 在 每 if (p < nia (a,j) signal (pti; 
一 种 情况 下 ,相应 迭代 空间 的 每 一 列 
组 成 一 个 任务 , 而 每 一 行 组 成 一 个 流 
水 线 阶段 。 我 们 把 第 i 个 阶段 分 配给 处 |/* o < psm o ; 
理 器 i 因此 每 个 处 理 器 执行 内 层 循环 | se G> a0 wait tp 
的 代码 。 不 考虑 边界 条 件 ， 只 有 在 处 X[p-i+1] = 1/3 * (X(p-i] + X[p-itt] + XIp-i+2]); 
理 器 p -1 执行 了 迭代 ;1 ae 处 理 if (p < mtn) & (p > i) signal (pti); 
器 p 才 可 以 执行 迭代 io 
假设 每 个 处 理 器 用 同样 的 时 间 来 
执行 一 个 迭代 , 并 且 同 步 运算 在 瞬时 图 11-52 图 11-51 中 的 代码 的 两 个 流水 线 化 实现 





a) 把 处 理 器 分 配给 各 行 





b) 把 处 理 器 分 配给 各 列 
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BE, RENKI ETAT PETA, 唯一 的 区 别 是 它们 的 处 理 器 分 配方 法 不 同 。 
在 图 1151b 中 的 迭代 空间 中 ,所 有 并 行 执行 的 迭代 处 于 135° 的 斜 线 上 , 这 些 斜 线 对 应 于 原先 代 
空间 中 的 150* 斜 线 ， 见 图 11-50b。 

但 是 在 实践 中 , 带 有 高 速 缓存 的 处 理 器 执行 同一 代码 所 花 的 时 间 并 不 总 是 相同 的 , 用 于 同步 
运算 的 时 间 也 会 有 所 变化 。 使 用 同步 栅 障 将 使 所 有 的 处 理 器 按照 一 致 的 步调 进行 运算 。 和 同步 
栅 障 方法 不 同 , 流水 线 化 技术 最 多 要 求 处 理 器 和 另外 两 个 处 理 器 进行 同步 和 通信 。 因 此 , 流水线 
化 的 波 阵 面 更 加 松弛 ， 允许 有 些 处 理 器 领先 而 其 他 处 理 器 暂时 落后 。 这 个 灵活 性 降低 了 处 理 器 
在 等 待 其 他 处 理 器 时 所 花 的 时 间 , 提高 了 并 行 性 能 。 

可 以 把 这 个 计算 任务 流水 线 化 的 方法 有 很 多 , 上 面 显 示 的 流水 线 化 方案 只 是 其 中 的 两 个 。 
我 们 说 过 , 只 要 一 个 循环 谨 套 结构 是 完全 可 交换 的 , 我 们 在 选择 代码 并 行 化 方案 方面 就 有 很 大 的 
自由 度 。 第 一 个 流水 线 方案 把 兴 代 [i 映射 到 处 理 器 i; 第 二 个 方案 把 迭代 [i 六 映射 到 处 理 器 j。 
只 要 co 和 ci 是 正常 数 , 我 们 就 可 以 把 先 代 [i 站 映射 到 处 理 器 coi + cj, 从 而 得 到 其 他 的 流水 线 
化 方案 。 这 样 的 方案 将 创建 出 不 同 的 流水 线 , 它们 的 松弛 波 阵 面 位 于 90"( 不 含 ) 到 180°( 不 含 ) 
之 间 。 

11. 9.5 一 般 性 的 理论 

刚刚 讨论 的 例子 解释 了 关于 流水 线 化 的 一 般 性 理论 : 如 果 我 们 能 够 在 一 个 循环 嵌 套 结构 中 
找到 至 少 两 个 不 同 的 最 外 层 循环 ， 并 满足 所 有 的 依赖 关系 , 那么 就 可 以 把 这 个 计算 过 程 流水 线 
化 。 一 个 具有 个 最 外 层 完 全 可 交换 循环 的 循环 说 套 结构 具有 -1 度 的 流水 线 化 并 行 度 。 

不 能 被 流水 线 化 的 循环 钳 套 结构 没有 可 交换 的 外 层 循 环 。 例 11. 56 给 出 了 这 样 的 例子 。 为 
了 遵循 所 有 的 依赖 关系 , 在 最 外 层 循环 中 的 每 个 迭代 必须 精确 执行 原来 代码 中 的 计算 任务 。 但 
是 , 这 样 的 代码 仍然 可 能 在 内 层 循环 中 包含 并 行 性 。 要 利用 这 种 并 行 性 , 我 们 必须 引入 至 少 ” 个 
同步 运算 , 其 中 是 最 外 层 循环 中 的 迭代 个 数 。 

DEJ A153 是 我 们 在 例 11.50 中 所 见 程序 的 一 个 更 复杂 的 版 本 。 如 图 11-53b 的 程序 依 
MERR, 语句 sl 和 ss 属于 同一 个 强 连 通 分 量 。 因 为 我 们 不 知道 矩阵 4 中 的 内 容 , 所 以 必须 假 
设 语句 s 中 的 访问 可 以 读 取 X 的 任何 元 素 。 从 语句 si 到 语句 s 之 间 有 一 个 真 依赖 关系 , 并 且 从 
语句 ss 到 语句 si 存在 一 个 反 依赖 关系 。 这 两 个 语句 都 没有 进行 流水 线 化 的 机 会 , 因为 属于 外 层 
循环 的 迭代 i 的 所 有 运算 必须 在 属于 迁 代 i+1 的 所 有 运算 之 前 进行 。 为 了 找到 更 多 的 并 行 性 ， 
我 们 对 内 层 循环 重复 并 行 化 过 程 。 第 二 个 循环 中 的 迭代 可 以 被 无 同步 地 并 行 化 。 因 此 , 我 们 需 
要 200 个 同步 栅 障 , 在 内 层 循环 的 每 次 执行 之 前 和 之 后 各 需要 一 个 。 口 


for (i = 0; i < 100; i++) { lies 
for (j = 0; j < 100; j++) 


Xij] = XLT + Yis];  /* (s1) */ Gs) (e) 
Z[i] = X[A[[i]]; ET A 


/* (s2) */ 
} 





a) b) 


图 11-53 ”一 个 顺序 化 的 外 层 循环 (参见 图 a) 以 及 它 的 PDC 图 (参见 图 b) 


11.9.6 ”时 间 分 划 约 束 
现在 我 们 关注 寻找 流水 线 化 并 行 性 的 问题 。 我 们 的 目标 是 把 一 个 计算 任务 转变 成 为 一 组 可 
流水 线 化 的 任务 。 为 了 找到 流水 线 化 的 并 行 性 , 我 们 没有 像 处 理 循环 并 行 性 时 那样 直接 求 出 各 
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个 处 理 器 上 将 执行 哪些 计算 ,而 是 提出 了 下 面 的 根本 性 问题 : 所 有 可 能 的 遵循 循环 中 原 有 数据 依 
赖 关 系 的 执行 序列 有 哪些 ?显然 ， 原来 的 执行 序列 满足 所 有 的 数据 依赖 关系 。 问 题 是 是 否 存在 
这 样 的 仿 射 转换 ,由 它 可 以 创建 男 一 种 调度 ， 使 得 最 外 层 循环 的 各 个 迭代 执行 的 运算 集合 和 原来 
不 同 , 但 是 依然 满足 所 有 的 依赖 关系 。 如 果 我 们 能 够 找到 这 样 的 转换 ， 就 能 够 把 这 个 循环 结构 流 
水 线 化 。 要 点 在 于 如 果 在 调度 运算 时 存在 自由 度 , 那么 就 存在 并 行 性 。 后 面 将 会 解释 如 何 从 这 
样 的 转换 中 获取 流水 线 化 并 行 性 的 细节 问题 。 

为 了 找 出 可 接受 的 外 层 循 环 的 重新 排序 ， 我 们 希望 为 每 个 语句 找到 一 个 一 维 仿 射 变换 ,这 个 
变换 把 原来 的 循环 下 标 值 映 射 到 最 外 层 循环 的 迭代 编号 上 。 如 果 这 样 的 分 配 能 够 满足 程序 中 的 
所 有 数据 依赖 关系 ,那么 变换 就 是 合法 的 。 下 面 显示 的 ” 时 间 分 划 约 束 ” 就 是 说 如 果 一 个 运算 依 
赖 于 另 一 个 运算 ， 那么 分 配给 前 一 个 运算 的 最 外 层 循环 的 迭代 必须 不 早 于 分 配给 第 二 个 运算 的 
迭代 。 如 果 它 们 被 分 配 到 同一 个 迭代 , 我 们 都 知道 在 此 迭代 中 第 一 个 运算 必须 在 第 二 个 之 后 
执行 。 

程序 的 一 个 仿 射 分 划 映 射 是 一 个 合法 的 时 间 分 划 (legal-time partition) 当 且 仅 当 对 于 任意 两 个 
具有 依赖 关系 的 (可 能 相同 的 ) 访 问 , 比如 机 套 在 循环 结构 di 中 的 语句 si 中 的 访问 

A = <Fi,fi,Bi ,b> 
和 嵌 套 在 循环 结构 dy 中 的 语句 ss 的 访问 
y= <F;,f,B, by > 
分 别 对 应 于 语句 s 和 s 的 一 维 分 划 映 射 < Cl ,cl > 和 < Cz ,ca > 满足 下 面 的 时 间 分 划 约 束 (time- 
partition constraint ) : 
。 对 于 满足 下 列 条 件 的 Z4 中 所 有 的 ii 和 22 PATA i 

bids peas 

2) Byi, +b, 20 

3) Bpi, +b, >0 

AF th both 

必然 有 Cii +e; SCzin + C70 

图 11-54 中 显示 的 这 个 约束 和 空间 分 划 约 束 看 起 来 非常 相似 。 它 是 空间 分 划 约 束 的 一 个 放松 
版 本 。 如 果 两 个 兴 代 指向 同一 个 位 
置 , 这 个 约束 不 要 求 它们 被 映射 到 
同一 个 分 划 单 元 。 我 们 只 要 求 这 两 
个 迭代 之 间 的 相对 执行 顺序 保持 不 
变 。 也 就 是 说 , 在 空间 分 划 约 束 中 
使 用 = 的 地 方 , 这 个 约束 使 用 <。 

我 们 知道 , 这 个 时 间 分 划 约 束 
至 少 存在 一 个 解 。 我 们 可 以 把 最 外 
层 循 环 的 每 个 迭代 中 的 运算 映射 到 
同一 个 迭代 中 去 ,此 时 所 有 的 数据 
依赖 关系 都 得 到 满足 。 对 于 那些 不 
能 被 流水 线 化 的 程序 , 这 个 解 是 它 图 11-54 ”时 间 分 划 约 束 
们 的 时 间 分 划 约 束 的 唯一 解 。 男 一 
方面 , 如果 我 们 能 够 找到 时 间 分 划 约 束 的 多 个 独立 解 , 这 个 程序 就 能 够 被 流水 线 化 。 每 个 独立 解 
对 应 于 最 外 层 完全 可 交换 循环 嵌 套 结构 中 的 一 个 循环 。 如 你 所 期 望 的 , 因为 例 11. 56 中 的 程序 没 
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有 可 流水 线 化 的 并 行 性 ,因此 从 中 抽取 得 到 的 时 间 分 划 约 束 只 有 一 个 独立 解 。 而 上 面 的 SOR 代 
码 的 例子 则 存在 两 个 独立 解 。 
我 们 考虑 一 下 例 11. 56, 特别 是 考虑 语句 s 和 sy 中 对 数组 的 引用 之 间 的 依赖 关 
系 。 因 为 语句 ss 中 的 访问 不 是 仿 射 的 , 所 以 在 涉及 语句 sa 的 依赖 分 析 中 , 我 们 把 矩阵 X EA 
一 个 标量 变量 , 从 而 近似 地 处 理 这 个 访问 。 令 (i 7) 为 si 的 一 个 动态 实例 的 下 标 值 , 令 i sa 的 
一 个 动态 实例 的 下 标 值 。 令 语句 s 和 ss 的 计算 任务 的 映射 分 别 为 <[cu,col,c > 
和 <[C2lj,cz >。 

让 我 们 首先 考虑 从 si 到 s 的 依赖 关系 所 决定 的 时 间 分 划 约 束 。 这 样 ,如 果 ii, 那么 转换 
之 后 的 si 的 第 (i,j) 个 迭代 不 得 晚 于 转换 之 后 的 s; 的 第 i 个 迭代 。 也 就 是 说 


i 
ie Co]| ] +e < Cui te 


展开 后 得 到 
CiiitCi2 +e; eC co 
AAT Mik’ HR, 所 以 可 以 取 任 意 大 的 值 , 因此 Cy =0 DAM. 可 知 ， 这 个 约束 的 一 个 可 
能 的 解 是 
Cu = Cy, =1 H C =e; =e, =0 

对 于 从 sz 到 si 以 及 从 ss 到 其 自身 的 依赖 关系 的 分 析 将 得 到 类 似 的 结果 。 外 层 循 环 的 第 i 个 
迭代 由 ss 的 第 i 个 实例 和 si 的 所 有 实例 (i,j) 组 成 。 在 这 个 特定 的 解 中 , 这 个 迭代 将 被 分 配给 第 ; 
个 时 间 步 又。 选择 其 他 的 Cy “C12 Cy, YC1SC2 的 值 会 得 到 类 似 的 分 配方 法 ， 但 是 会 存在 一 些 不 进 
行 任何 运算 的 时 间 步 又 。 也 就 是 说 , 调度 这 个 外 层 循 环 的 所 有 方法 都 要 求 其 中 的 迭代 按照 与 原 
代码 同样 的 顺序 进行 。 不 管 全 部 的 100 个 迭代 是 在 同一 个 处 理 器 上 执行 ,还 是 在 100 个 不 同 的 处 
理 器 上 执行 ,又 或 在 1 ~ 100 之 间 的 任意 多 个 处 理 器 上 运行 ,上 面 的 论断 都 成 立 。 O 
在 图 11-50a 中 显示 的 SOR 代码 中 , 写 引用 X[7 +1] MEAS, 以 及 代码 中 的 三 个 读 


引用 之 间 具 有 依赖 关系 。 我 们 要 为 该 赋值 语句 寻找 计算 任务 的 映射 < [ Ci ,C?2 ] ,。 >， 使 得 如 果 存 
EMAGA J) 的 依赖 关系 , 那么 


Le [i]t ei, ] +06 


根据 定义 ，(i,j)<(i,7') ,也 就 是 说 , BAi<i', Alisi Nj<j’). 
让 我 们 考虑 三 对 数据 依赖 关系 : 
1) 从 写 访问 X[j+ 坟 到 读 访 问 X[j+2] 之 间 的 真 依赖 关系 。 因 为 它们 的 实例 必须 访问 同一 
个 位 置 , 因此 j+1 =j +2, 或 者 说 j= +1。 把 j=j'+1 替换 到 时 间 约 束 中 , 我 们 得 到 
6 hE, 0 
y= +1 TA, 上 面 的 先后 关系 约束 归 约 为 i 癌 。 因 此 
; CG -C20 
2) 从 读 访问 XI7+2] 到 写 访问 DJ +1] 的 反 依赖 关系 。 这 里 7+2 =j +1, j=j 把 j= 
J -1 代入 时 间 约 束 我 们 得 到 
C,(i' -i) +C;=0 
i = 时 得 
CE0 
4i<i'N, AA C,>0, 我 们 得 到 
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C, 20 
3) 从 写 访 问 X[j+1] 到 自身 的 输出 依赖 。 这 里 j =。 时 间 约 束 被 归 约 为 
C;(i' =i) 20 
因为 只 有 i<i? 是 相关 的 , 我 们 还 是 得 到 
Ci 20 
其 余 的 依赖 关系 没有 产生 任何 新 的 约束 。 总 共有 三 个 约束 : 
C1=0 
C,>0 
Gi = 0950 


1 1 
Fos 
第 一 个 解 保 持 了 最 外 层 循环 的 迭代 执行 顺序 ; 图 11-50a 中 原来 的 SOR 代码 和 图 11-51a 中 转 
换 得 到 的 代码 都 是 这 种 安排 的 例子 。 第 二 个 解 把 沿 着 135" 斜 线 上 的 迭代 放置 在 外 层 循 环 的 同一 
个 迭代 中 。 图 11-51b 中 显示 的 是 具有 这 种 最 外 层 循环 组 成 方式 的 代码 的 一 个 例子 。 
请 注意 , 存在 多 个 其 他 可 能 的 独立 解 对 , 比如 


1, r2 
Lib 
也 是 具有 同样 约束 的 独立 解 。 我 们 选择 最 简单 的 向 量 来 简化 代码 转换 。 口 
11.9.7 用 Farkas 引 理 求解 时 间 分 划 约 束 
因为 时 间 分 划 约 束 和 空间 分 划 约 束 类 似 , 那么 是 否 可 以 用 一 个 类 似 的 算法 来 求解 这 些 约束 
呢 ? 遗 憾 的 是 , 两 类 问题 之 间 的 少许 不 同 使 得 两 个 解决 方法 在 技术 上 存在 很 大 不 同 。 算 法 11. 43 
直接 求解 Cl cl C, Me, 的 满足 下 面条 件 的 值 , 使 得 对 于 所 有 Z4 i, 和 2 中 的 记 , WR 
Fii +f, = Fain +f, 


下 面 是 这 些 约束 的 两 个 独立 解 : 


成 立 , 那么 
Cii +e, = Chin +6 

根据 循环 界限 而 得 到 的 线性 不 等 式 只 用 于 确定 两 个 引用 是 否 具有 数据 依赖 关系 , 没有 其 他 
用 途 。 

为 了 找 出 时 间 分 划 约 束 的 解 , 我 们 不 能 忽略 线性 不 等 式 i <i’, 忽略 它们 经 常会 使 得 只 存在 平 
凡 解 ， 而 平凡 解 会 把 所 有 的 迭代 都 放 到 同一 个 分 划 单 元 中 。 因 此 , 寻找 时 间 分 划 约 束 解 的 算法 必 
须 同 时 处 理 等 式 和 不 等 式 。 

我 们 希望 解决 的 一 般 性 问题 是 : 给 定 一 个 矩阵 4 , 找 出 一 个 向 量 e 使 得 对 于 所 有 满足 Ax 二 0 
的 向 量 x, 都 有 cx 二 0。 换 句 话 说 , 我 们 在 寻找 向 量 c，, 使 得 c 和 4x 二 0 所 定义 的 多 面体 之 内 任 
何 向 量 的 内 积 总 是 大 于 0。 

这 个 问题 可 以 用 Farkas 引 理 解决 。 令 4 为 一 个 mxn 的 实数 矩阵, Ae 为 一 个 实数 、 非 零 的 nn 
维 向 量 。Farkas 引 理 说 要 么 原 不 等 式 系统 

4ZE0O- ecTx<0 
具有 一 个 实数 解 x, 要 么 相应 的 对 偶 系 统 
A'y=c, y>0 
具有 一 个 实数 解 y, 但 是 两 者 不 会 同时 成 立 。 
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这 个 对 偶 系 统 可 以 用 Fourier-Motzkin 消除 法 进行 处 理 , 通过 投影 消除 变量 y。 这 个 引 理 保证 ， 
对 于 每 个 对 偶 系 统 中 有 和 解 的 向 量 c, 原 系统 不 存在 解 。 换 名 话说 , 我 们 可 以 找到 对 偶 系 统 A Ty = 
c, y>0 的 解 ， 从 而 证 明 系 统 的 否 命 题 , 即 对 于 所 有 满足 Ax 二 0 的 x, A cTx>S0, 








关于 Farkas 引 理 
关于 这 个 引 理 的 证 明 可 以 在 很 多 关于 线性 规划 的 标准 课本 中 找到 。 最 早 在 1901 年 被 证 
明 的 Farkas 引 理 是 择 一 性 定理 之 一 。 这 些 定理 相互 等 价 , 但 是 尽管 经 过 了 多 年 的 尝试 , 人们 
仍然 没有 找到 有 关 这 个 引 理 或 者 它 的 某 个 等 价 定 理 的 简单 、 直 观 的 证 明 。 





为 一 个 外 层 的 顺序 循环 找到 一 个 合法 的 最 大 线性 独立 的 仿 射 时 间 分 划 映 射 8 
输入 : 一 个 带 有 数组 访问 的 循环 熙 套 结构 。 

输出 : 线性 独立 时 间 分 划 映 射 的 最 大 集 。 

方法 : 算法 包括 以 下 步 又 

1) 找 出 程序 中 所 有 具有 数据 依赖 关系 的 访问 对 。 

2) 对 于 每 一 对 具有 数据 依赖 的 访问 , 在 循环 结构 di 中 的 语句 si 中 的 访问 .外 = <F,,f,,B,, 
bi > MRE EMA d, 中 的 语句 s2 的 访问 A =<F,, fh ,B,,b,>, 4 <C,,c,; > M< C yC2 > 
分 别 为 语句 s 和 s, 的 (未 知 的 ) 时 间 分 划 映 射 。 回 顾 一 下 , 时 间 分 划 约 束 是 说 : 

© 如 果 Za 中 所 有 的 五 AZ HY i, 满足 下 列 条 件 ， 

Dis i 

2) B,i, +b, 20 

3) Bi, +b, >0 

4) Fiii +f, = Foi, +f, 

那么 必然 有 Chi, +e; <Ci, +c, 

AA i kini 是 多 个 子 句 的 析 取 式 , 因此 我 们 可 以 为 每 个 子 句 创立 一 个 约束 系统 , 并 单独 对 它们 
求解 。 方 法 如 下 : 

@ 和 算法 11. 43 的 步骤 2@ AW, 对 方程 

Fii tf, = Fin +f, 





应 用 高 斯 消除 法 把 向 量 
i 
| 
1 
归 约 为 某 个 未 知 量 的 向 量 x。 
D Fe 为 这 个 分 划 映 射 中 的 所 有 未 知 量 。 把 因为 分 划 映 射 而 产生 的 线性 不 等 式 约束 可 写成 
c'Dx>0 
其 中 也 A— 
© 把 循环 下 标 变量 的 先后 关系 约束 和 循环 边界 表示 为 
Ax>0 
其 中 4 为 一 个 矩阵 。 


@ 应 用 Farkas 引 理 。 找 到 满足 上 面 两 个 约束 的 x 的 任务 等 价 于 寻找 满足 下 列 条 件 的 y: 
ATy =D"c Hy >0 
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请 注意 ,这 里 的 c™D 就 是 Farkas 引 理 中 的 c7， 而 且 我 们 使 用 的 是 这 个 引 理 的 否定 形式 。 

© 在 这 个 形式 中 ,应 用 Fourier-Motzkin 消除 法 把 的 变量 通过 投影 消除 ， 并 把 关于 系数 “ 的 
约束 表示 为 Ec>0, 

DA E'e' >0 为 不 包含 常量 项 的 约束 。 

3) 使 用 附录 B 中 的 算法 B. 1, 找 出 Bc'0 的 线性 独立 解 的 最 大 集合 。 这 一 复杂 的 算法 的 基 
本 思路 是 跟踪 每 个 语句 的 当前 解 集 ， 并 通过 插入 一 些 约束 不 断 寻找 更 多 的 独立 解 。 这 些 被 插 人 
的 约束 会 保证 相应 的 解 至 少 对 于 一 个 语句 来 说 是 线性 独立 的 。 

4) 根据 找到 的 每 个 解 “' 得 到 一 个 仿 射 时 间 分 划 映 射 。 映 射 的 常量 项 通过 不 等 式 Ec 30 得 
到 。 m 
例 11.57 的 约束 可 以 写作 


J 


i 
1 


[-Cy -Cy Cy Ga j 20 
i 
J 
[ at Om oeo 
L 
1 
Farkas 引 理 说 这 些 约 束 和 
| - Cy 
0 — C12 
= 三 0 
1 [a] Cy) ee 
0 Cy — ey 


等 价 。 解 这 个 不 等 式 系统 , 我 们 得 到 
Cu = Cy, 20 H Cp = en -01 =0 

请 注意 , 我 们 在 例 11. 57 中 得 到 的 特定 解 满足 这 些 约束 。 Oo 
11.9.8 代码 转换 

如 果 一 个 循环 嵌 套 结构 的 时 间 分 划 约束 存在 丰 个 独立 解 , 那么 就 可 能 把 这 个 循环 嵌 套 结构 转 
换 成 为 具有 上 个 最 外 层 完全 可 交换 循环 的 结构 。 可 以 对 这 个 结构 进行 转换 得 到 上 - 1 度 的 流水 
线 , 或 得 到 上 -1 个 可 并 行 化 的 内 层 循环 。 而 且 , 我 们 还 可 以 对 完全 可 交换 循环 应 用 分 块 技术 , 以 
提高 单 处 理 器 系统 的 数据 局 部 性 或 降低 并 行 执行 中 的 处 理 器 之 间 的 同步 开销 。 

利用 完全 可 交换 循环 

如 果 一 个 循环 嵌 套 结构 的 时 间 分 划 约束 具有 上 大 个 独立 解 , 我 们 就 可 以 容易 地 根据 这 些 解 生成 
一 个 循环 嵌 套 结构 ,其 最 外 层 的 个 循环 是 完全 可 交换 的 循环 。 通 过 直接 把 第 个 解 变 成 新 转换 
的 第 行 , 我 们 就 可 以 得 到 这 样 的 转换 。 一 旦 构造 出 这 个 仿 射 变换 , 我 们 就 可 以 使 用 算法 11. 45 
来 生成 代码 。 
在 例 11. 58 中 为 我 们 的 SOR 例子 找到 的 解 是 


eae a 
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今 第 一 个 解 为 转换 后 的 第 一 行 且 第 二 个 解 为 转换 后 的 第 二 行 ; 我 们 得 到 转换 
Wa 
1 l 
这 个 转换 生成 图 11-51a 中 的 代码 。 
如 果 我 们 把 第 二 个 解 作为 第 一 行 , 我 们 可 以 得 到 转换 
oh 
Laval 
它 生成 图 11-51c 中 的 代码 。 口 
显然 , 这 样 的 转换 产生 了 一 个 合法 的 顺序 程序 。 第 一 行 按照 第 一 个 解 来 分 划 整个 迭代 空间 。 时 间 
约束 保证 这 样 的 分 解 不 会 违反 任何 数据 依赖 关系 。 然 后 , 我 们 根据 第 二 个 解 对 各 个 最 外 层 循环 中 的 迭 
代 进 行 分 划 。 这 个 分 划 必 然 是 合法 的 ,原因 是 我 们 处 理 的 是 原来 的 迭代 空间 的 子 集 。 对 于 和 矩阵 中 的 其 
REIT, 以 上 讨论 仍然 成 立 。 因 为 我 们 可 以 任意 排列 这 些 解 ， 所 以 这 些 循环 是 完全 可 交换 的 。 
利用 流水 线 化 技术 
我 们 可 以 轻易 地 把 一 个 具有 上 个 最 外 层 完 全 可 交换 循环 的 循环 嵌 套 结构 转换 成 为 一 个 具有 
k-1 度 流水 线 并 行 性 的 代码 。 
DERA 让 我 们 回 到 SOR 的 例子 。 在 例子 中 的 循环 都 被 转换 为 完全 可 交换 的 循环 之 后 , 我 们 
知道 只 要 在 迭代 [ 计 ,i -1 和 [il -1,is] 执 行 之 后 , BRL i ] 就 可 以 被 执行 。 我 们 可 以 用 如 下 
方法 在 一 个 流水 线 中 保证 这 个 顺序 。 我 们 把 迭代 i 分 配给 处 理 器 pl 。 每 个 处 理 器 按照 原来 的 顺 
序 执行 内 层 循环 中 的 迭代 , 因此 保证 了 迭代 [ 记 i EER i -1 之 后 执行 。 另 外 , 我 们 要 求 
处 理 器 在 执行 迭代 [p,is ] 之 前 必须 等 待 处 理 器 p -1 的 信号 , 这 个 信号 表明 处 理 器 p -1 已 经 执 
行 了 迭代 [p -1,i]。 这 个 技术 可 以 根据 图 11-51a 和 图 1151b 中 的 完全 可 交换 循环 分 别 生成 图 
11-52a 和 图 11-52b 中 的 代码 。 oO 
一 般 来 说 , 给 定 大 个 最 外 层 的 完全 可 交换 循环 , 具有 下 标 值 (i ,… i, ) 的 迭代 可 以 执行 且 不 
违反 数据 依赖 约束 的 前 提 是 下 列 迭 代 
[a -1,in,- uy], Li, ty —1,%5,°** ig], tee, | 
已 经 执行 完毕 。 因 此 , 我 们 可 以 按照 如 下 方法 把 这 个 迭代 空间 的 前 -1 个 维度 的 分 划分 配 到 
0(n*-1) 个 处 理 器 上 。 每 个 处 理 器 负责 一 个 迭代 的 集合 ,该 集合 中 逃 代 的 下 标 值 在 前 大- 1 个 维 
度 上 相同 ， 而 第 大 个 下 标 值 则 包括 了 该 下 标的 全 部 可 能 值 。 每 个 处 理 器 顺序 地 执行 第 大 个 循环 中 
的 迁 代 。 前 并- 1 个 循环 下 标 值 [Pi p2 ,ph_1] 所 对 应 的 处 理 器 可 以 执行 第 k 个 循环 的 第 i 个 迭 
代 的 前 提 是 它 收 到 了 处 理 器 
bpy Lp pp Ns pr pe oper tl 
发 出 的 信号 , 表明 它们 已 经 执行 完了 各 自 的 第 大 个 循环 中 的 第 让 个 迭代 。 
波 阵 面 化 
根据 一 个 具有 个 最 外 层 完全 可 交换 循环 的 循环 结构 生成 -1 个 可 并 行 化 内 层 循环 是 比较 
容易 的 。 虽 然 我 们 更 倾向 于 使 用 流水 线 化 , 但 为 完整 起 见 , 我 们 仍 在 这 里 给 出 这 个 方法 。 
我 们 使 用 一 个 新 的 下 标 变量 i 来 分 划一 个 具有 上 个 最 外 层 完全 可 交换 循环 的 循环 结构 的 计 
算 任务 , 其 中 ;被 定义 为 这 上 个 可 交换 循环 中 所 有 下 标的 某 种 组 合 。 比 如 , isi +… + 让 就 是 这 
样 的 一 个 组 合 。 
我 们 创建 一 个 最 外 层 的 顺序 循环 , 该 循环 以 升序 遍历 这 个 之 分 划 , 在 各 个 分 划 单元 中 的 计算 
任务 依然 按 以 前 的 顺序 执行 。 每 个 分 划 单 元 中 的 前 -1 个 循环 一 定 是 可 并 行 化 的 。 直 观 地 讲 ， 
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如 果 给 定 一 个 二 维 的 迭代 空间 , 这 个 转换 沿 着 135。 的 斜 线 把 迭代 组 合 起 来 , 作为 外 层 循环 的 一 次 
执行 。 这 个 策略 保证 了 在 最 外 层 循环 中 的 各 个 迭代 之 间 没有 数据 依赖 。 

分 块 

一 个 深度 为 大 的 完全 可 交换 的 循环 嵌 套 结构 可 以 在 上 个 维度 上 进行 分 块 。 我 们 可 以 把 多 个 
迭代 的 块 组 合成 为 一 个 单元 ， 而 不 是 根据 最 外 层 或 者 最 内 层 的 循环 下 标 值 把 迭代 分 配给 处 理 器 。 
分 块 技术 可 以 用 于 增强 数据 局 部 性 并 最 小 化 流水 线 的 开销 。 

假设 我 们 有 一 个 二 维 完全 可 交换 的 循环 谨 套 结构 ,如 图 11-55a 所 示 ， 县 我们 希望 把 这 个 结构 的 计 
算 任务 分 成 5 xb 块 。 分 块 后 的 代码 的 执行 顺序 如 图 11-56 所 示 ， 等 价 的 代码 显示 在 图 11-55b 中 。 











for (ii = 0; ii<n; i+=b) 
for (jj = 0; jj<n; jj+=b) 
for (i = iixb; i <= min(ii*b-1, n); i++) 
for (j = iixb; j <= min(jj*b-1, pn); jr) í 
<S> 


for (i=0; i<n; i++) 
for (j=1; j<n; j++) { 


<5> 


} } 





a) ANERE b) SA PRR EE POH Deh 
11-55 —* ARDEA AE RS 











a) ZA b) 之 后 
图 11-56 在 对 一 个 深度 为 2 的 循环 嵌 套 结构 分 块 之 前 和 分 块 之 后 的 执行 顺序 


如 果 我 们 把 每 个 块 分 配给 一 个 处 理 器 , 那么 在 同一 个 块 中 从 一 个 迭代 到 另 一 个 迭代 的 数据 
传递 不 需要 处 理 器 之 间 的 通信 。 我 们 还 可 以 把 块 的 一 列 分 配给 一 个 处 理 器 ;以便 加 粗 流 水 线 的 
粒度 。 请 注意 , 每 个 处 理 器 只 在 块 的 边界 上 和 它 的 前 驱 及 后 继 进行 通信 。 因 此 ,分 块 的 另 一 个 优 
点 是 程序 只 需要 在 块 和 它 的 邻居 块 的 边界 上 [aan o 

交换 被 访问 的 数据 。 处 于 块 内 部 的 数据 仅 由 for G = 1; j < i-l; j+) { 


一 个 处 理 器 处 理 。 for (k z1; k s= j-1; k++) f 
X(i,j] = XU) - X04,k] * XCJ, E]; 
Gi) 11. 63 现在 我 们 使 用 一 个 真实 的 数值 再 二 | 


F 
算 法 一 一 Cholesky 分 解 一 一 来 说 明 算 法 for (m= 1; m <= i-1; mt+) 


11. 59 混 如 何在 只 有 流水线 化 并 行 性 的 情况 | an AST EEA Mem ttm 
下 处 理 单 循环 信 套 结构 的 。 图 11-57 中 显示 |? 

的 代码 实现 了 二 个 O(n?) 的 算法 ,该 算法 对 

一 个 二 维 数据 数组 进行 运算 。 被 执行 的 迭代 A i i 
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空间 是 一 个 三 角形 的 金字 塔 结构 , 因为 j 只 会 帝 历 到 外 层 循 环 下 标 i 的 值 , 而 只 会 遍历 到 j 的 
值 。 这 个 循环 结构 有 四 个 语句 ， 各 个 语句 都 谷 套 在 不 同 的 循环 中 。 

对 这 个 程序 应 用 算法 11.59 可 以 找到 三 个 合法 的 时 间 维 度 。 它 把 所 有 的 运算 都 嵌入 到 一 个 
三 维 的 完全 可 交换 的 循环 找 套 结构 中 去 。 其 中 的 某 些 运算 在 原 程序 中 是 嵌 套 在 深度 为 1 或 2 的 
循环 结构 中 的 。 图 11-58 中 显示 了 得 到 的 代码 和 相应 的 映射 。 


for (i2 = 1; i2 <= N; i2++) 
for (j2 = 1; j2 <= i2; j2++) { 

/* 处 理 器 (i2,j2) 的 代码 的 开始 */ 

for (k2 = i; k2 <= 12; k2++) { 


// $t: 12 =i, j2=j, k2=k 
if (j2<i2 && k2<j2) 
X(i2,j2] = X(i2,j2]) - X[i2,k2]) * X[j2,k2]; 


// 映射 : i2 = i, j2= j, k2 = j 
if (j2==k2 && j2<i2) 
X(i2,j2] = X(42,j2] / X(j2,j2]; 


// 映射 ;i2 = i, j2 =i, k2=m 
if (i2==j2 && k2<i2) 
X[i2,i2] = X{i2,i2] - X[i2,k2] * X[i2,k2]; 


// 映射 : i2 = i, j2= i, k2 = i 
if (i2==j2 && j2==k2) 
X[k2,k2] = sqrt (X[k2,k2]); 


} 
/* 处 理 器 (i2,j2) 的 代码 的 结束 */ 





图 11-58 ， 写成 完全 可 交换 循环 结构 的 图 11-57 的 代码 


代码 生成 例 程 保证 了 运算 的 执行 都 位 于 原来 的 循环 界限 中 ,以 保证 新 的 程序 只 执行 原来 代 
码 中 的 运算 。 我 们 可 以 把 这 个 代码 流水 线 化 ,方法 是 把 这 个 三 维 结构 映射 到 二 维 的 处 理 器 空间 
Hg. BEAR (i2 2 ,h2) WATA ID 为 (这 沁 ) 的 处 理 器 。 每 个 处 理 器 执行 循环 下 标 为 12 的 最 内 层 的 
循环 。 在 它 执行 第 个 迭代 之 前 , 这 个 处 理 器 会 等 待 功 为 (六 — 1 72) MC, -1) 的 处 理 器 发 来 
的 信号 。 在 它 执行 了 它 的 迭代 之 后 , 它 会 给 处 理 器 ( 记 +1, 甩 ) 和 ( 认 , 忆 +1) 发 出 信号 。 口 
11.9.9 具有 最 小 同步 量 的 并 行 性 

在 前 面 的 三 节 中 , 我 们 已 经 描述 了 三 个 功能 强大 的 并 行 化 算法 : 算法 11.43 可 以 找 出 所 有 不 
需要 同步 的 并 行 性 , 算法 11. 54 找 出 了 所 有 只 需要 固定 多 次 同步 的 并 行 性 , 而 算法 11. 59 找 出 了 
所 有 需要 0(n) 次 同步 的 可 流水 线 化 的 并 行 性 , 其 中 是 最 外 层 循环 的 迭代 数量 。 粗 略 地 说 ,我 
们 的 目标 是 尽 可 能 多 地 把 一 个 计算 过 程 并 行 化 , 同时 尽量 少 地 引入 同步 运算 

下 面 的 算法 11. 64 从 最 粗糙 的 并 行 性 粒度 开始 , 找 出 了 一 个 程序 中 存在 的 所 有 并 行 度 。 在 实 
RH, 在 为 某 个 多 处 理 器 系统 并 行 化 一 个 代码 时 ,我 们 并 不 需要 利用 所 有 层次 上 的 并 行 性 。 我 们 
总 是 利用 最 外 层 的 并 行 性 , 直到 所 有 的 计算 任务 都 被 并 行 化 , 并 且 所 有 的 处 理 器 都 被 完全 利用 
为 止 。 
ER 全 找 出 一 个 程序 中 存在 的 所 有 并 行 度 ,同时 所 有 并 行 性 的 粒度 都 尽 可 能 地 粗糙 。 

输入 ; 一 个 要 进行 并 行 化 的 程序 。 

输出 ; 同一 个 程序 的 并 行 化 版 本 。 
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方法 : 完成 下 列 步 又 : 

1) 找 出 不 需要 同步 运算 的 并 行 性 的 最 大 度数 , 对 这 个 程序 应 用 算法 11. 43。 

2) 找 出 需要 0(1) 次 同步 运算 的 并 行 性 的 最 大 度数 : 对 步骤 1 中 找 出 的 所 有 空间 分 划 单 元 应 
用 算法 11.54。〈 如 果 在 步 又 1 中 没有 找到 无 同步 的 并 行 性 , 那么 所 有 的 计算 任务 都 在 同一 个 分 
划 单 元 中 。) 

3) 找 出 需要 0(n) 次 同步 运算 的 最 大 并 行 性 度数 。 对 步骤 2 中 找到 的 每 个 分 划 单元 应 用 算 
法 11. 59, 以 找 出 可 流水 线 化 的 并 行 性 。 然 后 对 分 配给 各 个 处 理 器 的 分 划 单 元 逐个 应 用 算法 
11. 54。 如 果 前 面 没有 找到 流水 线 化 的 并 行 性 ,就 对 串 行 循环 的 循环 体 应 用 算法 11. 54。 

4) 在 逐步 增加 同步 度数 的 情况 下 寻找 最 大 的 并 行 性 度数 。 递 归 地 把 步骤 3 应 用 到 上 一 步 生 
成 的 各 个 空间 分 划 单 元 中 的 计算 任务 上 。 口 
四 现在 让 我 们 回 到 例 11: 56。 算 法 11. 64 的 步 又 1 和 2 都 没有 找到 并 行 性 。 也 就 是 说 ， 
为 了 并 行 化 这 个 代码 , 我 们 需要 的 同步 量 大 于 一 个 常量 。 在 步骤 3 中 , 应 用 算法 11. 59 确定 了 只 
有 一 个 合法 的 外 层 循环 , 这 个 循环 就 是 图 11-53 中 的 原 代码 中 的 循环 。 因 此 , 这 个 循环 不 具有 可 
流水 线 化 的 并 行 性 。 在 步骤 3 的 第 二 部 分 , 我 们 应 用 算法 11. 54 来 并 行 化 内 层 循环 。 我 们 像 处 理 
整个 程序 那样 来 处 理 一 个 分 划 单元 中 的 代码 , 不 同 之 处 仅 在 于 我 们 像 处 理 符号 常量 那样 处 理 了 
分 划 单元 的 编号 。 在 这 个 例子 中 ,我 们 发 现 内 层 循环 是 可 并 行 化 的 , 因此 这 个 代码 可 以 使 用 个 
同步 栅 障 进行 并 行 化 。 o 

算法 11. 64 找 出 了 一 个 程序 中 在 各 个 同步 层面 上 的 并 行 性 。 这 个 算法 优先 求 出 需要 较 少 同 
步 量 的 并 行 化 方案 , 但 是 最 少 同步 运算 并 不 表示 通信 量 是 最 少 的 。 这 里 我 们 讨论 这 个 算法 的 两 
个 扩展 , 以 解决 此 算法 的 弱点 。 

考虑 通信 开销 

如 果 没 有 发 现 无 同步 的 并 行 性 , 算法 11. 64 的 步骤 2 对 每 个 强 连通 分 量 独立 地 进行 并 行 化 。 
但 是 , 某 些 这 样 的 分 量 仍然 可 能 在 无 同步 和 通信 的 情况 下 被 并 行 化 。 解 决 方法 之 一 是 尽 可 能 地 
在 程序 依赖 图 中 共享 大 部 分 数据 的 子 集 之 间 寻 找 无 同步 的 并 行 性 。 

如 果 强 连通 分 量 之 间 的 通信 是 必须 的 , 我们 注意 到 有 些 通信 的 开销 要 高 过 其 他 通信 的 开销 。 
比如 , 转 置 一 个 矩阵 的 开销 要 比 两 个 相 邻 处 理 器 之 间 通 信 的 开销 高 得 多 。 假 设 :和 s 分 别 是 两 
个 分 离 的 强 连通 图 中 的 语句 , CAER i 和 is 中 访问 相同 的 数据 。 如 果 我 们 不 能 分 别 为 
语句 si 和 ss 找到 分 划 映 射 <C1,c1 > 和 < Cy ,cs > 使 得 

Cii te, -Cis -cz =0 
我 们 就 试图 满足 约束 

Cyt, +cl - Ci, -c2 SÔ 
其 中 6 是 一 个 小 的 常量 。 

用 通信 量 交换 同步 量 

有 些 时 候 , 我 们 宁愿 多 进行 一 些 同步 运算 以 降低 通信 和 量 。 例 11. 66 讨论 了 一 个 这 样 的 例子 。 
因此 ,如 果 我 们 不 能 在 只 允许 相 邻 的 强 连通 分 量 之 间 进 行 通信 的 情况 下 对 一 个 代码 进行 并 行 化 ， 
我 们 将 试图 把 这 个 计算 任务 流水 线 化 ,而 不 是 独立 地 并 行 化 各 个 分 量 。 如 例 11. 66 所 示 , 流水 线 
化 技术 可 以 被 应 用 到 一 个 循环 序列 中 。 

RRM 对 于 你 11. 49 中 的 ADI SEMA, 我 们 已 经 说 明 对 第 一 和 第 二 个 循环 嵌 套 结构 进行 
独立 优化 可 以 在 每 个 嵌 套 结构 中 找到 并 行 性 。 但 是 , 这样 的 方案 机 求 在 循环 之 间 进 行 矩 阵 转 置 ， 
从 而 出 现 O(n?) 的 数据 流量 。 如 果 我 们 使 用 算法 11. 59 来 寻找 可 流水 线 化 的 并 行 性 , 就 可 以 把 整 
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个 程序 转换 成 为 一 个 完全 可 交换 的 循环 
BE, 如 图 11-59 所 示 。 然 后 , 我 
们 可 以 应 用 分 块 技术 来 降低 通信 开销 。 
这 个 方案 将 带 来 0(n) 次 的 同步 , 但 是 } 
需要 的 通信 量 要 小 很 多 。 回 
11.9.10 11.9 节 的 练习 图 11-59 例 11.49 的 代码 的 一 个 完全 可 交换 循环 媒 套 结构 

练习 11.9.1: 在 11.9.4 节 中 , 我 们 讨论 了 使 用 倾斜 的 轴 ， 而 不 是 用 水 平 轴 或 垂直 轴 来 将 图 
11-51 中 的 代码 流水 线 化 的 可 能 性 。 对 于 以 下 度数 的 斜 线 , 写 出 和 图 11-52 中 的 循环 类 似 的 代码 : 
(iy 135% ORE 

练习 11. 9. 2; 如 果 b 能够 整除 n, 那么 图 11-55b 可 以 进一步 简化 。 按 照 这 种 假设 改写 代码 。 

练习 11.9.3: 图 11-60 中 是 一 个 计算 Pasca 三 角形 的 前 100 行 的 程序 。 也 就 是 说 , XOS si <100， 
P[i, 首 将 变 成 从 个 物体 中 选择 7 个 物 


for (J = 0; J <n; g++) 
for G = 13 i <‘nt1; i++) 4 
af aUL a) XE = FQ ie X[i-t, jI) 


if (Cj > 0) XL td CNL Ll ill 








or (i=0;.i ; i++) { 
PRENITA f Po TP /* si */ 
1) 把 这 个 代码 改写 为 单一 的 、 完 全 RH 


可 交换 的 循环 戏 套 结构 。 as (i=2; i<100; 

2) 在 一 个 流水 线 中 使 用 100 个 处 理 
器 来 实现 这 个 代码 。 为 每 个 处 理 器 p 写 
出 其 代码 ,并 指出 必要 的 同步 运算 。 

3) 使 用 边 长 为 10 个 迭代 的 块 改写 
这 个 代码 。 因 为 迭代 空间 形成 了 一 个 三 角形 , 总 共 只 有 14+2+…+10=55 个 块 。 用 p1、p2 作为 
参数 来 表示 一 个 处 理 器 (pi ,ps ) 的 代码 , 该 处 理 器 被 分 配给 i 方向 上 的 第 pi 个 块 和 j 方 向 上 的 第 
P2 AE 

练习 11. 9. 4: 对 图 11-61 中 的 代码 重复 练习 11.9.3, 但 是 请 注意 ,这 个 问题 的 迭代 形成 了 一 
个 边 长 为 100 的 三 维 立方 体 。 因 此 ， 
问题 3 中 的 块 应 该 是 10 x10 x10, A 
有 1000 个 块 。 

| 练习 11. 9. 5: 让 我 们 对 一 个 简 
单 的 时 间 分 划 约 束 的 例子 应 用 算法 
11. 59。 在 下 面 的 内 容 中 假设 向 量 计 | } 
是 (i jy), TH bp FE (in jn) ME 


i++) 
for) G= sds jtt) 


Pii, j] = Pli-1,j-1] +.Pli-1,j];__/*, 83, */ 








图 11-60 计算 Pascal 三 角形 


for (i=0; i<100; i++) { 
Ati, 0,0] = Bins 
A[i,99,0] = B2[i]; 


/* si */ 
/* s2 */ 


for (j=1; j<99; j++) { 
AL 0,j,0] = B3Cjl; 
A[99,j,0] = B4[j]; 


/* s3 */ 
/* s4 */ 


for (i=0; i<99; i++) 
for (j=0; j<99; j++) 


REH, 这 两 个 向 量 都 是 转 置 的 。 条 
44 iy xas i 由 下 列子 句 的 析 取 式 
构成 : 

® i, < 记 , 或 者 

i =i, A, <j 
其 他 的 等 式 和 不 等 式 是 





for (k=1; k<100; k++) 
ALi, j,k] = A*ALY, j k=1)] + Ali-1,j,k-1] 十 
Aliti,j,k-1] + Ali, j-1,k-1]"+ 


Ala, j+i,k-1]5 /* sb */ 


Al 11-61 练习 11. 94 的 代码 


2i, +j, -10 >0 


in + 0 0 


j =i, +40 
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最 后 ， 时 间 分 划 不 等 式 如 下 ， Hp cadier sez sdo 和 ez 为 未 知 量 : 
ci, +diji +e, Sealy + dajz + ez 
1) 对 情况 四 ; Bi, <i, 求解 这 个 时 间 分 划 约 束 。 特别 地 ,你 需要 尽 可 能 地 消除 站 Vi2 和 
万 ,并 像 算 法 11. 59 PIRE REER D MA, 然后 对 得 到 的 矩阵 不 等 式 应 用 Farkas 引 理 。 
2) 对 于 情况 @;， Hi, =i Ai <h, 重复 问题 1。 


11.10 ”局 部 性 优化 


不 管 一 个 处 理 器 是 不 是 某 个 风 处 理 器 系统 的 一 部 分 , 它 的 性 能 和 它 的 高 速 缓 存 的 行为 密切 
相关 。 高 速 缓存 中 的 脱 靶 可 能 要 花费 几 十 个 时 钟 周 期 ， 因 此 高 速 缓存 的 高 脱 疲 率 会 使 处 理 器 性 
能 降低 。 在 带 有 公共 内 存 总 线 的 多 处 理 器 系统 的 背景 下 ， 对 总 线 的 竞争 会 进一步 加 剧 低劣 的 数 
据 局 部 性 所 带 来 的 损失 。 

我 们 将 看 到 ,即使 我 们 只 是 希望 提高 单 处 理 器 系统 的 数据 局 部 性 , 用 于 并 行 化 的 仿 射 分 划算 
法 也 是 有 用 的 。 它 是 一 个 有 效 的 寻找 循环 转换 机 会 的 工具 。 在 本 节 中 , 我 们 描述 了 三 种 在 单 处 
理 器 系统 和 多 处 理 器 系统 中 提高 数据 局 部 性 的 技术 。 

1) 我 们 试图 在 计算 结果 生成 之 后 尽快 地 使 用 它们 ,以 提高 计算 结果 的 时 间 局 部 性 。 提 高 时 
间 局 部 性 的 方法 是 把 一 个 计算 任务 分 割 成 为 独立 的 分 划 单 元 , 并 把 各 个 分 划 单 元 中 具有 依赖 关 
系 的 运算 紧 靠 在 一 起 执行 。 

2) 数组 收缩 (array contraction ) 技 术 降低 了 一 个 数组 的 维度 ， 且 降低 了 被 访问 内 存 位 置 的 数 
目 。 如 果 在 任意 给 定时 刻 该 数组 只 有 一 个 位 置 被 使 用 , 我 们 就 可 以 应 用 数组 收缩 技术 。 

3) 除了 提高 计算 结果 的 时 间 局 部 性 , 我 们 也 需要 优化 计算 结果 的 空间 局 部 性 , 同时 优化 只 
读数 据 的 时 间 和 空间 局 部 性 。 我们 可 以 交替 执行 多 个 分 划 单 元 , 而 不 是 一 个 接 一 个 地 执行 它们 。 
这 样 做 可 以 使 得 分 划 单 元 之 间 的 复 用 更 加 靠近 。 

11.10.1 计算 结果 数据 的 时 间 局 部 性 

仿 射 分 划算 法 把 所 有 相互 依赖 的 运算 放 到 一 起 。 通 过 串 行 执 行 这 些 分 划 , 我 们 提高 了 计算 
结果 数据 的 时 间 局 部 性 。 让 我 们 回顾 一 下 11.7. 1 节 中 讨论 的 多 网 格 的 例子 。 应 用 算法 11. 43 来 
并 行 化 图 11-23 中 的 代码 , 找到 了 2 度 的 并 行 性 。 图 11-24 中 的 代码 包含 两 个 外 层 循环 , 它们 顺 
序 遍历 了 各 个 独立 的 分 划 单元 。 转 换 得 到 的 这 个 代码 具有 较 好 的 局 部 性 , 因为 计算 得 到 的 结 采 
立刻 就 在 同一 个 迭代 中 使 用 。 

因此 , 即使 我 们 的 目标 是 优化 顺序 执行 , 使 用 并 行 化 技术 找 出 这 些 相 关 的 运算 并 把 它们 放 到 
一 起 也 是 很 有 好 处 的 。 我 们 在 这 里 使 用 的 算法 和 算法 11. 64 类 似 , 它 从 最 外 层 循 环 开始 寻找 所 有 
的 并 行 性 粒度 。 如 11: 9. 9 节 中 讨论 的 , 如 果 我 们 在 每 个 层次 上 都 不 能 找到 无 同步 的 并 行 性 , 这 
个 算法 就 对 各 个 强 连通 分 量 单独 进行 并 行 化 。 这 个 并 行 化 方法 常常 会 增加 通信 量 。 因 此 , 如 果 
被 单独 并 行 化 的 强 连 通 分 量 之 间 存 在 复 用 , 我 们 就 尽 可 能 地 把 它们 组 合 起 来 。 

11. 10.2 ”数组 收缩 

数组 收缩 优化 给 出 了 另 一 个 在 存储 和 并 行 性 之 间 进 行 折衷 处 理 的 例子 。 这 种 折衷 方案 首先 
在 10. 2. 3 节 中 讨论 指令 级 并 行 性 时 引入 。 使 用 更 多 寄存 器 可 以 得 到 更 大 的 指令 级 并 行 性 。 同 
样 , 使 用 更 多 的 内 存 可 以 得 到 更 多 的 循环 级 并 行 性 。 如 11.7. 1 节 中 的 多 网 格 例子 所 示 ， 把 一 个 
临时 的 标量 变量 变 成 一 个 数组 就 可 以 允许 不 同 的 迭代 使 用 这 个 临时 变量 的 不 同 实例 ,也 就 允许 
它们 同时 执行 。 反 过 来 , 如 果 我 们 有 一 个 每 次 只 操作 一 个 数组 元 素 的 顺序 执行 过 程 , 就 可 以 收缩 
这 个 数组 ,把 它 替 换 为 一 个 标量 , 并 让 各 个 迭代 使 用 同一 个 位 置 。 
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在 图 11-24 中 显示 的 转换 得 到 的 多 网 格 程序 中 , ARORA NICE AIH ET AP. AM 
TIK D 的 一 行 中 的 不 同 元 
素 。 如 果 这 些 数组 不 会 在 这 个 
代码 段 之 外 使 用 , 这 些 迭 代 就 














for (j = 2, j <= jl; Jt) 
for (i = seat, Tet 
AP 5 


可 以 串 行 地 复 用 同一 个 数据 存 oar una we 
储 位 置 , 而 不 是 把 这 些 值 分 别 he z O aF 
or (k=3, k <= kl-1, k++ 
存放 在 不 同 的 元 素 中 或 者 不 同 AM = AP; 
行 中 。 图 11-62 显示 了 减少 这 3 b ‘ene -AM4D[k-1] 2.3 
些 数组 的 维度 之 后 的 结果 。 这 D[k] = T*AP; 


DWw[i,k,j,i] = Te(DWL[1,k,j,i]+DW[1,k-1,j,i])...; 


个 代码 比 原来 的 代码 运行 得 更 
快 , 因为 它 读 写 的 数据 更 少 。 
特别 是 当 一 个 数组 被 归 约 成 一 
个 标量 变量 时 , 我 们 可 以 把 这 
个 变量 放 在 一 个 寄存 器 中 , 并 
完全 消除 了 对 内 存 访问 的 
需求 。 

因为 使 用 的 内 存 更 少 , 所 以 可 用 的 并 行 性 也 变 少 了 。 转 换 得 到 的 图 11- 62 中 的 代码 的 和 
代 之 间 有 了 数据 依赖 关系 , 因此 不 能 再 并 行 执行 。 为 了 把 代码 在 P 个 处 理 器 上 并 行 执行 ,我 
们 可 以 把 每 个 标量 变量 扩展 出 个 副本 , 并 让 每 个 处 理 器 访问 自己 的 副本 s 这 样 , 内 存 扩展 
的 数量 就 和 被 利用 的 并 行 性 直接 相关 了 。 

通常 ,要 寻找 数组 收缩 机 会 的 理由 有 三 个 : 

1) 用 于 科学 应 用 的 高 级 程序 设计 语言 (比如 Matlab 和 Fortran90) 支持 数组 层次 的 运算 。 数 组 
运算 的 每 个 子 表达 式 都 生成 一 个 临时 数组 。 因 为 这 些 数组 可 能 很 大 , 每 个 数组 运算 ,比如 乘法 或 
加 法 , 需要 读 写 很 多 内 存 位 置 ,同时 对 算术 运算 的 需求 相对 较 少 。 因 此 ,我们 对 运算 进行 重新 排 
序 以 便 数 据 被 生成 后 立刻 就 被 消耗 掉 ， 同时 也 就 把 这 些 数组 收缩 成 了 标量 变量 。 这 样 的 处 理 是 
很 重要 的 。 

2) 在 20 世纪 80 和 90 年 代 构造 的 超级 计算 机 都 是 向 量 机 ,因此 那 时 开发 的 很 多 科学 计算 
应 用 都 是 针对 这 样 的 机 器 进行 优化 的 。 虽 然 存 在 向 量化 编译 器 , 但 很 多 程序 员 依然 把 他 们 的 
代码 写成 每 次 完成 一 次 向 量 运算 的 方式 。 本 章 中 多 网 格 代码 的 例子 就 是 这 种 风格 的 程序 的 
例子 。 

3) 收缩 优化 的 机 会 也 会 由 编译 器 引入 。 如 多 重 网 格 例子 中 的 变量 了 所 演示 的 ,一 个 编译 器 
可 能 会 扩展 数组 以 提高 并 行 性 。 如 果 这 种 空间 扩展 是 不 必要 的 , 那么 我 们 就 必须 对 这 个 数组 进 
行 收缩 处 理 。 
数组 表达 式 2 = W +X + Y BRR 


for (i=0; i<nj i++) T[i] = Wli] + xi]; 
for (i=0; i<n; i++) Z[i] = T[i] + Y(il; 


把 这 个 代码 改写 成 

for. (i=03 i<n;| i++) {1 T= Wii] xa =T A il Y 
可 以 极 大 地 提高 代码 的 运行 速度 。 当 然 , 在 C 代码 的 层次 上 我 们 甚至 不 需要 使 用 临时 变量 7, 而 
是 可 以 把 对 Z[ 引 的 赋值 语句 写成 单个 语句 。 但 这 里 我 们 正 试图 对 中 间 代 码 层 次 进行 建 模 。 在 这 
个 层次 上 一 个 向 量 处 理 器 将 会 处 理 这 些 运 算 。 回 


} 


for (k=kl-1, k>=2, k--) 
DW(1,k,j;i] = DW(1,k,j,i] +D[k]*DW[1,k+1,j,i]; 


图 11-62 对 图 11-23 进行 分 划 ( 图 11-24) 和 
数组 收缩 之 后 的 得 到 的 代码 
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数组 收缩 。 

输入 : 一 个 由 算法 11. 64 转换 得 到 的 程序 。 

输出 : 一 个 等 价 的 程序 , 但 降低 了 数组 的 维度 。 

方法 : 一 个 数组 的 维度 可 以 被 收缩 为 一 个 元 素 的 条 件 如 下 : 

1) 每 个 独立 的 分 划 单 元 只 使 用 这 个 数组 的 一 个 元 素 。 

2) 这 个 元 素 在 分 划 单元 入 口 处 的 值 没有 被 这 个 分 划 单 元 使 用 , 且 

3) 这 个 元 素 的 值 在 这 个 单元 的 出 口 处 不 活跃 。 

找 出 可 收缩 的 维度 ,也 就 是 满足 上 面 三 个 条 件 的 维度 , 并 把 它们 替换 为 单个 元 素 。 口 

算法 11. 68 假设 这 个 程序 首先 由 算法 11. 64 进行 转换 , 把 所 有 相互 依赖 的 运算 都 分 配 到 同一 
个 分 划 单元 中 , 并 顺序 地 执行 这 些 分 划 单元 。 它 找 出 了 其 元 素 在 不 同 迭 代 中 活跃 范围 不 相交 的 
数组 变量 。 如 果 这 些 变量 在 循环 之 后 不 再 活跃 ， 它 就 可 以 收缩 这 个 数组 并 让 处 理 器 在 同一 个 标 
` 量 位 置 上 进行 运算 。 在 数组 收缩 之 后 , 可 能 还 有 必要 选择 性 地 扩展 一 些 数组 ,以 应 对 并 行 性 和 其 
他 局 部 性 优化 问题 。 

这 里 要 进行 的 活跃 性 分 析 比 9. 2.5 节 中 所 描述 的 分 析 更 加 复杂 。 如 果 数 组 被 定义 为 一 个 全 
局 变量 , 或 者 它 是 一 个 参数 , 我 们 就 需要 使 用 过 程 间 分 析 技术 来 保证 不 使 用 出 口 处 的 值 。 不 仅 如 
此 , 我 们 还 需要 计算 单个 数组 元 素 的 活跃 性 , 保守 地 把 数组 当 作 一 个 标量 进行 活跃 性 分 析 会 使 结 
果 不 够 精确 。 

11. 10. 3 ”分 划 单 元 的 交织 

一 个 循环 中 的 不 同 分 划 单 元 经 常 读 取 同样 的 数据 , 或 者 读 写 同样 的 高 速 缓 存 线 。 在 本 节 和 
接 下 来 的 两 节 中 , 我 们 将 讨论 当 发 现 了 分 划 单 元 之 间 的 复 用 时 如 何 优化 局 部 性 。 

最 内 层 块 的 复 用 

我 们 采用 一 个 简单 的 模型 ， 即 如 果 一 个 数据 在 少量 迭代 之 后 就 被 复 用 , 那么 就 可 以 在 高 速 组 
存 中 找到 这 个 数据 。 如 果 最 内 层 循环 具有 很 大 或 未 知 的 界限 , 那么 只 有 最 内 层 循环 的 迭代 之 间 
的 复 用 才能 够 带 来 更 好 的 局 部 性 。 分 块 处 理 过 程 创建 了 具有 和 较 小 且 已 知 界限 的 内 层 循环 , 使 得 
我 们 可 以 充分 利用 整个 计算 块 之 内 或 块 之 间 的 复 用 。 因 此 , 分 块 技术 具有 促进 更 多 维度 复 用 的 
作用 。 
考虑 图 11-5 中 显示 的 矩阵 乘法 代码 以 及 图 11-7 中 该 代码 的 分 块 版 本 。 和 矩阵 乘法 在 
它 的 三 维 迭 代 空 间 中 的 每 一 个 维度 上 都 有 复 用 。 在 原来 的 代码 中 , 最 内 层 循环 具有 个 迭代 ， 其 
H n ERAK, 且 可 能 很 大 。 我 们 的 简单 模型 假设 只 有 跨越 最 内 层 循环 迭代 的 被 复 用 数据 才 可 
以 在 高 速 缓存 中 找到 。 

在 分 块 版 本 中 , 最 内 层 的 三 个 循环 执行 了 一 个 三 维 的 计算 任务 块 。 这 个 三 维 块 的 每 条 边 长 
都 是 妃 个 欠 代 。 这 个 块 的 大 小 是 由 编译 器 选择 的 。 这 个 大 小 必须 足够 小 , 使 得 在 计算 分 块 时 读 
写 的 所 有 高 速 缓存 线 能 够 一 起 放 到 高 速 缓存 中 。 因 此 ,跨越 自 外 而 内 的 第 三 层 循环 的 迭代 的 复 
用 数据 可 以 在 高 速 缓存 中 找到 。 Oo 

我 们 把 具有 较 小 且 已 知 界限 的 最 内 层 循环 集合 称 为 最 内 层 分 块 (innermost block), 4424 BT 
能 , 我 们 期 望 最 内 层 块 包含 所 有 可 能 带 有 数据 复 用 的 迭代 空间 的 维度 。 把 分 块 边 长 最 大 化 并 不 
重要 。 以 矩阵 乘法 为 例 , 三 维 分 块 技术 把 对 每 个 矩阵 的 数据 访问 量 降低 了 B 倍 。 如 果 存 在 数据 
复 用 , 使 用 高 维度 小 边 长 的 分 块 要 比 低 维 度 大 边 长 的 分 块 更 好 。 

我 们 可 以 对 具有 复 用 关系 的 循环 进行 分 块 , 从 而 优化 最 内 层 完 全 可 交换 循环 嵌 套 结构 的 局 
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部 性 。 我 们 也 可 以 把 分 块 概念 泛 化 ; 以 利用 在 较 外 层 并 行 循环 的 迭代 之 间 找 到 的 复 用 。 请 注意 ， 
分 块 技 术 主要 是 交错 地 执行 内 层 循环 的 少量 实例 。 在 矩阵 乘法 中 , 最 内 层 循环 的 每 个 实例 计算 
出 结果 数组 的 一 个 元 素 , 总 共有 n 个 这 样 的 元 素 。 分 块 技术 把 一 个 块 的 实例 执行 交织 起 来 ,每 
次 计算 每 个 实例 中 的 B 个 迭代 。 类 似 地 , 我 们 可 以 把 并 行 循环 中 的 迭代 交替 执行 , 以 利用 它们 之 
间 的 数据 复 用 。 

下 面 我 们 定义 了 两 个 基本 方法 , 它们 可 以 降低 跨越 迭代 的 复 用 之 间 的 距离 。 我 们 从 最 外 层 
循环 开始 反复 应 用 这 两 个 基本 方法 , 直到 所 有 的 复 用 都 被 移动 到 最 内 层 块 的 相 邻 位 置 上 。 

在 一 个 并 行 循环 中 交织 内 层 循 环 

考虑 一 个 外 层 可 并 行 化 循环 包含 一 个 内 层 循 环 的 情况 。 为 了 利用 外 层 循 环 迭 代 之 间 的 数据 
SA, 我 们 把 固定 多 个 内 层 循 环 的 实例 交织 在 一 起 执行 , 如 图 11-63 所 示 。 通 过 创建 二 维 内 层 分 
块 , 这 个 转换 降低 了 外 层 循环 的 连续 迭代 之 间 的 数据 复 用 之 间 的 距离 。 


for (ii=0; ii<n; ii+=4) 
for (j=0; jsn; j++) 


for (i=ii; i<min(m, ii+4); i++=4) 
<S> 





b) 转换 得 到 的 代码 
图 11-63 ”把 内 层 循环 的 4 个 实例 交织 执行 


把 一 个 循环 
for (i=0; i<n; i++) 
<S> 


变 成 

for (ii=0; ii<n; ii+=4) 

for (i=ii; ii<min(n, ii+4); ii+=4) 
<S> 

的 步骤 称 为 条 状 挖掘 (stripmining) 。 当 图 11-63 中 的 外 层 循 环 的 界限 较 小 且 已 知 时 , 我 们 不 需要 
对 它 进 行 条 状 挖掘 ， 而 是 直接 交换 原 程序 中 的 两 个 循环 。 

交织 执行 一 个 并 行 循环 中 语句 

考虑 一 个 可 并 行 化 循环 包含 一 个 语句 序列 51 ,ss ，…,sm 的 情况 。 如 果 其 中 的 一 些 语句 本 身 也 
是 循环 , 那么 连续 迭代 的 语句 之 间 可 能 还 是 相隔 了 很 多 运算 。 我 们 可 以 使 用 交织 运行 这 些 语句 
的 方法 来 利用 迭代 之 间 的 数据 复 用 , 如 图 11-64 所 示 。 这 个 转换 在 不 同 的 语句 之 间 分 布 那 些 经 过 
了 条 状 挖掘 的 循环 。 如 果 外 层 循环 只 有 少量 的 固定 多 个 迭代 , 我 们 不 需要 对 循环 进行 条 状 挖掘 ， 
而 是 直接 在 各 个 语句 上 分 布 原来 的 循环 。 


for (ii=0; ii<n; ii+=4) { 
for (i=ii; i<min(n,ii+4); i++) 
for (i=0; i<n; i++) { <S1> 
<S1> ; for (i=ii; i<min(n,ii+4); i++) 
<S2> <S2> 














a) 源 程序 b) 转换 后 的 代码 


图 11-64 ”交织 语句 的 转换 
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我 们 使 用 s GO) 来 表示 语句 si 在 第 j 个 迭代 中 的 运行 。 代码 的 执行 不 是 按照 图 11- 65a 中 显示 
的 原 执行 顺序 ; 而 是 按照 图 11-65b 中 显示 的 顺序 执行 。 
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a) 原来 的 顺序 b) 转换 得 到 的 顺序 


图 11-65 ”分布 一 个 经 过 条 状 挖掘 的 循环 


E 我 们 现在 回 到 多 网 格 的 例子 , 说明 如 何 利用 外 层 并 行 循环 的 迭代 之 间 的 数据 复 用 。 
我 们 观察 到 , 图 11-62 的 代码 的 最 内 层 循环 中 的 引用 DW[1,k,j,i]、DW[1,k-1,j,i] 和 DW[1, 
k+1,j,i] 的 空间 局 部 性 很 差 。 根 据 11.5 节 中 讨论 的 复 用 分 析 可 知 ,下 标 变量 为 ;的 循环 具有 空 
间 局 部 性 , 而 下 标 为 的 循环 具有 组 复 用 性 。 下 标 为 的 循环 已 经 是 最 内 层 循环 了 , 因此 我 们 感 
兴趣 的 是 交织 执行 来 自 一 个 具有 连续 i 值 的 分 划 块 中 的 对 DW 的 运算 。 

我 们 应 用 这 个 转换 来 交织 这 个 循环 中 的 语句 , 得 到 图 11-66 中 的 代码 , 然后 应 用 这 个 转换 来 
交织 内 层 循环 , 得 到 图 11-67 中 的 代码 。 请 注意 ， 当 我 们 把 来 自 下 标 为 ;的 循环 的 下 个 迭代 交错 
执行 时 , 我 们 需要 把 变量 4P .4M、7 扩展 为 数组 , 以 便 一 次 存放 B 个 结果 。 E] 





for (j = 2, j <= jl, j++) 
for (ii = 2, ii <= il, iit=b) { 
for (i = ii; i <= min(iitb-1,i1); i++) { 
i = i-ii+1; 


= 1.0/(1.0 +AP[ib]) ; 
= T*AP[ib] ; 
DW(1,2,j,i] = T*DW[1,2,j,4]; 
Re 
for (i) S241; (i *<=\min(iit+b-1,11); i++) { 
for (k=3, k <= kl-1, k++) 
ib = i-ii+1; 
AP [ib]; 


...AP[ib]-AM*D[ib,k-1]...; 
T*AP; 
DW[i,k,j,i] = T*(DW(1,k,j,i]+DW[1,k-1,j,i])...; 
} 


for (i = ii; i <=*min(iit+b-1,i1); i++) 
for (k=kl1-1, k>=2, k--) { ; 
DW[1,k,j,i] = DW[1,k,j,i] 4+D{iw,k] *DW[1,k+1,j,i]; 
/* Ends code to be executed by processor (j,i) */ 


} 
F 





Æ 11-66 对 图 11-23 的 代码 进行 分 划 、 数组 收缩 、 内 层 循环 交错 和 分 块 后 所 得 的 部 分 代码 


并 行 性 和 局 部 性 优化 565 











| for (j = 2, j <= jl, j++) 
for (ii = 2, ii <= il, iit=b) { 
for (i = ii; i <= min(iitb-1,i1); i++) { 


ib = i-iit+1; 

AP [ib] =i g3 

T = 1.0/(1.0 +AP[ib]); 
D[2,ib] = T*AP[ib] ; 
DW(1,2,j,i] = T*DW[1,2,j,i]; 


} 
for (k#3, k <=: Ri- k++) 
for (i = ii; i <= min(ii+b-1,il); i++). { 








ib = i=-iiti; 

AM = AP[ib]; 

AP [ib] SENG nai 

T = ...AP[ib]-AM*D[ib,k-1]...; 
D{ib,k] = TxAP; 

DW[1,k,j,i] = T*(DWL1,k,j,iJ+DW([1,k-1,j,i])...; 


} 


for (k=kl-1, k>=2, k--) { 
for (i = iip i <= min(iitb-1,il); itt) 
DW(1,k, j,i] = DW[1,k, j,i] +DLiw,k]*DW([1,k+1, j,i]; 
/* Ends code to be executed by processor (j,i) */ 


} 
J 





图 11-67 对 图 11-23 的 代码 进行 分 划 、 数 组 收缩 和 分 块 后 所 得 的 部 分 代码 


11. 10.4 合成 

算法 11.71 对 一 个 单 处 理 器 系统 的 局 部 性 进行 了 优化 , 而 算法 11. 72 则 对 一 个 多 处 理 器 系统 
的 并 行 性 和 局 部 性 进行 了 优化 。 
在 一 个 单 处 理 器 系统 上 优化 数据 局 部 性 。 

输入 : 一 个 带 有 仿 射 数组 访问 的 程序 。 

输出 : 一 个 最 大 化 数据 局 部 性 的 等 价 程序 。 

方法 : 执行 下 列 步 又 : 

1) 应 用 算法 11. 64 来 优化 计算 结果 的 时 间 局 部 性 。 

2) 应 用 算法 11. 68 在 可 能 的 时 候 收缩 数组 。 

3) 利用 11.5 节 中 描述 的 技术 , 确定 可 能 共享 相同 数据 或 高 速 缓存 线 的 迭代 子 空间 。 对 于 每 
个 语句 , 找 出 具有 数据 复 用 的 外 层 并 行 循环 的 维度 。 

4) 对 每 个 带 有 数据 复 用 的 外 层 并 行 循环 , 重复 使 用 基本 的 交织 方法 ,把 一 个 闪 代 分 块 移动 
到 最 内 层 块 中 。 

5) 对 位 于 那些 带 有 复 用 的 最 内 层 的 完全 可 交换 循环 中 的 维度 的 子 集 应 用 分 块 技术 。 

6) 对 外 层 完全 可 交换 循环 谨 套 结构 进行 分 块 ,其 目的 是 利用 内 存 层次 结构 中 的 更 高 层 存储 
设备 , 比如 第 三 层 高 速 缓 存 或 物理 内 存 。 

7) 在 必要 的 地 方 按照 块 的 边 长 扩展 标量 或 者 数组 。 o 
针对 多 处 理 器 系统 优化 并 行 性 和 数据 局 部 性 。 

输入 : 一 个 带 有 仿 射 数组 访问 的 程序 。 

输出 : 一 个 最 大 化 并 行 性 和 数据 局 部 性 的 等 价 程序 。 

方法 ; 执行 下 列 步 又 ; 
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1) 使 用 算法 11. 64 对 这 个 程序 进行 并 行 化 , 并 创建 一 个 SPMD 程序 。 

2) 对 步骤 1 中 生成 的 SPMD 程序 应 用 算法 11.71, 以 优化 它 的 局 部 性 。 口 
11. 10.5 11. 10 节 的 练习 : 

练习 11. 10. 1: 对 下 面 的 向 量 运 算 进行 数组 收缩 变换 : 


for (i=0; ï<n; i++) TI = Ali] * BL]; 
for (i=0; i<n; i++) D[i] = T[i] + Cli; 


练习 11. 10. 2: 对 下 面 的 向 量 运算 进行 数组 收缩 变换 : 
for (i=0; i<n; i++) Ti] = Afi] + BENS 
for (i=0; i<n; i++) S[i] = C[i]-+ Di]; 
for (i=0; i<n; i++) Efi] = T[i] * S[i]; 


练习 11. 10. 3: 以 10 为 宽度 对 下 面 的 外 层 循环 进行 条 状 挖 气 : 
or (i=n-1; i>=0; i--) 
i for pee ae j++) 


11.11 仿 射 转换 的 其 他 用 途 


至 今 为 止 , 我 们 的 注意 力 都 集中 在 共享 内 存 的 计算 机 体系 结构 上 , 但 是 仿 射 循环 转换 的 理论 
还 有 很 多 其 他 的 应 用 。 我 们 可 以 把 仿 射 转换 应 用 到 其 他 形式 的 并 行 性 上 , 包括 分 布 式 内 存 计算 
机 、 向 量 指令 、SIMD( Single Instruction Multiple Data, 单 指令 多 数据 ) 指 令 以 及 多 指令 发 送 计算 机 
等 。 本 章 中 介绍 的 复 用 分 析 技 术 也 可 以 用 于 数据 预 取 (prefetehing) 。 数 据 预 取 是 一 个 可 以 提高 内 
存 性 能 的 有 效 技术 。 
11. 11. 1 “分布 式 内 存 计算 机 

在 分 布 式 内 存 计 算 机 中 ,处理 器 通过 发 送 消息 和 其 他 处 理 器 进行 通信 。 对 于 这 类 机 器 ,给 各 
个 处 理 器 分 配 大 型 的 ,独立 的 计算 单元 显得 更 加 重要 。 仿 射 分 划算 法 可 以 生成 这 样 的 单元 。 除 了 
计算 任务 的 分 划 , 还 存在 其 他 一 些 编译 问题 需要 处 理 : 

1) 数据 分 配 。 如 果 处 理 器 使 用 的 是 一 个 数组 的 不 同 部 分 , 每 一 个 处 理 器 只 需要 分 配 足 够 的 
容 间 以 存放 各 自 使 用 的 部 分 。 我 们 可 以 使 用 投影 的 方式 来 决定 每 个 处 理 器 使 用 数组 的 哪个 部 分 。 
在 决定 数据 分 配 时 , 输入 是 一 个 线性 不 等 式 系 统 , 该 系统 表示 循环 界限 , 数组 访问 函数 ,以 及 把 
迭代 映射 到 处 理 器 ID 的 仿 射 分 划 。 我 们 通过 投影 消除 循环 下 标 , 并 找 出 每 个 处 理 器 ID 所 使 用 的 
数组 位 置 。 

2) 通信 代码 。 我 们 需要 明确 生成 向 其 他 处 理 器 发 送 以 及 从 其 他 处 理 器 接收 数据 的 代码 。 在 
每 个 同步 点 上 ， 

D 确定 存放 在 某 个 处 理 器 上 且 其 他 处 理 器 需要 使 用 的 数据 。 

© 生成 具有 如 下 功能 的 代码 : 找 出 所 有 将 被 发 送 的 数据 并 把 它们 打包 放 到 一 个 缓冲 区 中 。 

@ 类 似 地 , 确定 这 个 处 理 器 需要 的 数据 , 解 开 接收 到 的 消息 的 数据 包 , 把 数据 移动 到 适当 的 
内 存 位 置 。 

如 果 所 有 的 访问 都 是 仿 射 的 , 那么 这 些 任 务 仍然 可 以 由 编译 器 使 用 仿 射 框架 来 完成 。 

3) 优化 。 并 不 是 所 有 的 通信 都 必须 在 同步 点 上 进行 。 比 较 好 的 做 法 是 每 个 处 理 器 在 数据 可 
用 时 立刻 发 送 数据 , 而 每 个 处 理 器 只 有 在 需要 数据 时 才 开 始 等 待 。 必 须 对 这 个 优化 和 男 一 个 目 
标 ( 即 不 能 生成 太 多 消息 ) 加 以 权衡 ,因为 处 理 每 个 消息 的 开销 都 比较 大 。 

这 里 描述 的 技术 还 有 其 他 用 途 。 比 如 , 一 个 专用 的 内 人 式 系统 可 能 使 用 协 处 理 器 来 减轻 
某 些 计算 负担 。 骨 人 式 系统 也 可 能 使 用 一 个 独立 的 控制 器 把 数据 加 载 进 高 速 绥 存 或 其 他 数据 
缓冲 区 ,或 从 中 外 载 ， 而 不 是 自己 要 求 把 数据 调 人 高速 缓存 ; 在 独立 控制 器 调动 数据 时 ;处 理 
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器 可 同时 在 其 他 数据 上 执行 运算 。 在 这 些 情况 下 , 我 们 可 以 使 用 类 似 的 技术 来 生成 移动 数据 
的 代码 。 
11. 11.2 多 指令 发 送 处 理 器 

我 们 也 可 以 使 用 仿 射 循环 转换 来 优化 多 指令 发 送 计 算 机 的 性 能 。10. 5 节 讨 论 过 , 一 个 软件 
流水 线 化 循环 的 性 能 受到 两 个 因素 的 限制 : 先后 关系 约束 中 的 环 , 以 及 对 关键 资源 的 使 用 。 通 过 
改变 最 内 层 循环 的 组 成 , 我 们 可 以 改进 这 些 限 制 。 

首先 , 我 们 可 以 使 用 循环 转换 来 创立 最 内 层 的 可 并 行 化 循环 , 从 而 完全 消除 先后 关系 约束 中 
的 环 。 假 设 一 个 程序 有 两 个 循环 ,其 中 的 外 层 循环 是 可 并 行 化 的 ,而 内 层 循环 不 可 并 行 化 。 我 们 
可 以 交换 这 两 个 循环 ,使 得 内 层 循环 变 成 可 并 行 化 的 , 从 而 创造 出 更 多 的 指令 级 并 行 化 机 会 。 请 
注意 , 我 们 并 不 要 求 最 内 层 循环 的 迭代 之 间 一 定 是 完全 可 并 行 化 的 。 只 要 其 依赖 关系 所 确定 的 
环 短 到 可 以 充分 利用 硬件 资源 就 是 够 了 。 

我 们 也 可 以 通过 改进 一 个 循环 中 资源 使 用 的 平衡 性 来 放松 因 资 源 使 用 而 引起 的 限制 。 假 设 
一 个 循环 只 使 用 加 法 器 , 而 另 一 个 只 使 用 乘法 器 。 假 设 一 个 循环 因为 内 存 而 受到 制约 , 另 一 个 循 
环 因为 计算 量 而 受到 制约 。 比 较 好 的 做 法 是 把 这 些 例子 中 的 循环 对 融合 到 一 起 , 以 便 同 时 充分 
利用 所 有 的 功能 单元 。 
11.11.3 向 量 和 SIMD 指令 


除了 多 指令 问题 之 外 , 还 有 其 他 两 种 重要 的 指令 级 并 行 性 : 向 量 和 SIMD 运算 。 在 这 两 种 情 
况 下 , 发 送 一 个 指令 可 以 对 一 个 数据 向 量 的 所 有 元 素 进 行 相同 运算 。 

前 面 提 到 过 , 很 多 早期 的 超级 计算 机 使 用 了 向 量 指令 。 向 量 运算 以 流水 线 化 的 方式 执行 ,该 
向 量 的 元 素 被 串 行 获取 , 对 不 同 元 素 的 计算 相互 重 又 。 在 先进 的 向 量 计算 机 中 , 向 量 运算 可 以 链 
BEK: 当 生 成 结果 向 量 的 元 素 时 , 它们 立刻 被 另 一 个 向 量 指令 的 运算 消耗 掉 , 不 需要 等 待 所 有 
的 结果 都 计算 完成 。 不 仅 如 此 , 在 具有 散播 /收集 (scattergather) 硬件 的 先进 计算 机 中 , 向 量 的 元 
素 不 要 求 是 连续 的 ,可 以 用 一 个 下 标 向 量 确定 这 些 元 素 该 放 在 哪里 。 

SIMD 指令 指定 了 对 连续 内 存 位 置 执 行 的 相同 运算 。 这 些 指令 从 内 存 中 并 行 加 载 数据 , 把 它 
们 存放 在 宽 寄存 器 中 , 并 使 用 并 行 硬 件 来 计算 它们 。 很 多 媒体 、 图 形 和 数字 信和 号 处 理应 用 可 以 利 
用 这 些 运算 。 低 端 媒体 处 理 器 只 需要 一 次 发 射 一 个 SIMD 指令 就 可 以 获得 指令 级 并 行 性 。 高 端 处 
理 器 可 以 把 SIMD 和 多 指令 发 射 结合 起 来 以 获取 更 好 的 性 能 。 

SIMD 及 向 量 指令 生成 和 数据 局 部 性 优化 之 间 具 有 很 多 相似 性 。 当 我 们 找到 在 连续 内 存 位 
置 上 运算 的 独立 分 划 单 元 时 ， 就 对 这 些 和 迭代 进行 条 状 挖掘 ,并 把 最 内 层 循环 中 的 运算 交织 
起 来 。 

生成 SIMD 指令 有 两 个 难点 。 首 先 ， 有 些 机 器 要 求 从 内 存 中 获取 的 SIMD 数据 是 位 对 齐 的 。 
比如 , 它们 可 能 要 求 将 256 字 节 的 SIMD 运算 分 量 放 在 为 256 的 倍数 的 地 址 上 。 如 果 源 循环 只 在 
一 个 数据 数组 上 运算 , 我 们 可 以 生成 一 个 主 循环 来 处 理 对 齐 的 数据 ， 而 这 个 循环 的 前 面 和 后 面 都 
有 附加 的 代码 来 计算 边界 上 的 元 素 。 但 是 对 于 在 多 个 数组 上 运算 的 循环 , 就 有 可 能 无 法 同时 对 
齐 所 有 的 数据 。 第 二 , 一 个 循环 的 连续 迭代 所 使 用 的 数据 可 能 不 是 连续 的 。 这 种 例子 包括 很 多 
重要 的 数字 信号 处 理 的 算法 ,比如 Viterbi 解码 器 和 快速 健 里 叶 变 换 。 要 利用 SIMD 指令 的 话 , 有 
可 能 需要 一 些 额外 的 用 于 移动 数据 的 指令 。 

11. 11.4， 数 据 预 取 


没有 哪个 数据 局 部 性 优化 方法 可 以 消除 所 有 的 内 存 访问 。 首 先 , 第 一 次 使 用 的 数据 必须 从 
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内 存 中 获取 。 为 了 隐藏 内 存 访问 的 延 时 , 预 取 指 令 (prefetch instruction ) 被 很 多 高 性 能 处 理 器 采 
用 。 数 据 预 取 指令 被 用 来 向 处 理 器 指明 某 些 数据 有 可 能 很 快 就 会 被 用 到 , 因此 如 果 它 现在 还 没 
有 在 高 速 缓存 中 , 期 望 能 把 它 加 载 到 高 速 缓存 中 。 

11.5 节 中 描述 的 复 用 分 析 可 以 用 于 估计 什么 时 候 可 能 发 生 高 速 缓 存 脱 轰 。 当 生成 预 取 指 
Sit, 有 两 个 重要 问题 需要 考虑 。 如 果 将 要 访问 连续 的 内 存 位 置 , 我 们 只 需要 为 每 个 高 速 组 
存 线 发 出 一 个 预 取 指 令 。 我 们 必须 足够 早 地 发 出 预 取 指令 , 以 保证 在 使 用 这 个 数据 时 , 它 已 
经 在 高 速 缓存 中 了 。 但 是 , 我 们 不 应 该 过 早 地 发 出 预 取 指令 。 预 取 指令 可 能 会 把 高 速 缓存 中 
还 需要 使 用 的 数据 转移 出 高 速 缓 存 ， 而 预 取 到 的 数据 也 可 能 会 因此 在 使 用 之 前 就 被 调 出 高 速 
缓存 了 。 


考虑 下 面 的 代码 : 


for (4-0; Tlic itt) 
for (j=0; j<100; j++) 
ALis jens 
假设 目标 机 器 有 一 个 预 取 指 令 。 该 指令 可 以 一 次 预 取 两 个 字 
的 数据 , 而 一 个 预 取 指 令 的 延 时 大 约 等 于 上 面 的 循环 中 六 次 
送 代 的 执行 时 间 。 图 11-68 中 显示 了 这 个 例子 的 使 用 预 取 指 
令 的 代码 。 
我 们 把 最 内 层 的 循环 展开 两 次 ,使 得 可 以 为 每 个 高 速 组 
存 线 发 出 一 个 预 取 指 令 。 我 们 使 用 软件 流水 线 化 概念 来 保证 
在 数据 被 使 用 的 六 个 迭代 之 前 预 取 数 据 。 流 水 线 的 前 言 部 分 
获取 了 前 6 个 交代 中 使 用 的 数 疾 ,稳定 状态 循环 在 它 渤 行 计 图 蕊 :68 ”为 巴 取 数据 而 修改 的 代码 
算 的 同时 提前 预 取 6 个 迭代 。 尾 声 部 分 没有 预 取 指 令 ， 只 是 直接 执行 余下 的 迭代 。 口 


11.12 %11 章 总 结 


o 数组 的 并 行 性 和 局 部 性 。 对 于 并 行 性 和 基于 局 部 性 的 优化 而 言 , 最 重要 的 机 会 来 自 于 访 
问 数组 的 循环 。 在 这 些 循环 中 , 对 数组 元 素 的 各 个 访问 之 间 的 依赖 关系 通常 是 有 限 的 ， 
并 且 通 常 按照 一 个 正则 的 模式 访问 数组 元 素 。 这 些 因素 使 程序 可 以 获得 很 好 的 数据 局 部 
E, 高 效 使 用 缓存 。 

© 仿 射 访问 。 几 乎 所 有 的 并 行 化 及 数据 局 部 性 优化 的 理论 和 技术 都 假设 对 数组 的 访问 是 仿 
射 的 : 这 些 数组 下 标的 表达 式 是 循环 下 标的 线性 函数 。 

。 和 迭代 空间 : 一 个 具有 d 个 循环 的 循环 嵌 套 结构 定义 了 一 个 d 维 的 迭代 空间 。 该 空间 中 的 
点 都 是 值 的 d 元 组 , 元 组 中 的 值 对 应 于 该 嵌 套 循环 结构 运行 时 各 个 循环 下 标的 取 值 。 在 
仿 射 情况 下 , 各 个 循环 下 标的 界限 是 较 外 层 循环 下 标的 线性 函数 ,因此 迭代 空间 是 一 个 
多 面体 。 

© Fourier-Motzkin 消除 算法 。 对 迭代 空间 的 关键 操作 之 一 是 把 定义 该 空间 的 各 个 循环 重新 排 
列 。 这 么 做 要 求 把 一 个 多 面体 迭代 空间 投影 到 它 的 部 分 维度 上 。Fourier-Motzkin 算法 把 
一 个 给 定 变量 的 上 下 界 蔡 换 成 为 关于 这 些 界限 的 不 等 式 。 

© 数据 依赖 与 数组 访问 。 在 为 了 并 行 性 和 局 部 性 优化 的 目的 而 处 理 循环 时 ,， 我们 需要 解决 
的 一 个 中 心 问题 是 确定 两 个 数组 访问 之 间 是 否 具有 数据 依赖 关系 (也 就 是 它们 是 否 可 能 
触及 同一 个 数组 元 素 ) 。 如 果 这 些 访 问 以 及 循环 界限 都 是 仿 射 的 , 迭代 空间 就 可 以 被 定义 
为 一 个 多 面体 。 而 上 面 的 问题 可 以 被 表示 为 一 个 特定 的 矩阵 = 向量 方 程 是 否 具有 位 于 该 















for’ (4=0; 1143; i++) 1 
for (j=0; j<6; j+=2) 
prefetch(#ALi,j]); 
for (j=0; j<94; j+=2) { 
prefetch(#ALi, j+6]); 
Aigla 
AB tS Ss 
} 
for (j=94; j<100; j++) 
he AP 
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多 面体 中 的 解 。 

矩阵 的 秩 和 数据 复 用 。 用 来 描述 一 个 数组 访问 的 矩阵 可 以 给 出 多 个 关于 该 数组 访问 的 
重要 信息 。 如 果 该 矩阵 的 秩 达到 最 大 值 ( 即 矩 阵 的 行 数 和 列 数 的 最 小 值 ) 那么 当 这 个 
循环 迭代 运行 时 ,数据 访问 不 会 两 次 触及 同一 个 元 素 。 如 果 数 组 是 按 行 ( 列 ) 存 放 的 ， 
那么 删除 掉 最 后 (最 前 ) 一 行 后 得 到 的 矩阵 的 秩 可 以 告诉 我 们 这 个 访问 是 否 具有 良好 的 
局 部 性 ， 即 单个 高 速 缓存 线 中 的 元 素 被 几乎 同时 访问 。 

数据 依赖 关系 和 和 寺 瘟 图 方程 。 如 果 我 们 仅仅 知道 对 同一 数组 的 两 个 访问 触及 该 数组 的 同 
一 区 域 , 我 们 并 下 能 判定 它们 是 否 真 的 访问 了 某 个 公共 元 素 。 原 因 是 每 个 访问 都 可 能 跳 
过 某 些 元 素 。 比 如 , 一 个 访问 读 写 偶数 号 元 素 , 另 一 个 访问 读 写 奇数 号 元 素 。 为 了 确定 是 
否 存 在 数据 依赖 关系 ; 我 们 必须 求 一 个 丢 番 图 方程 (只 要 整数 解 ) 的 解 。 

解 丢 番 图 线性 方程 ; 关键 技术 是 计算 各 个 变量 的 系数 的 最 大 公约 数 (GCD)。 RA MRT 
最 大 公约 数 能 够 整除 常量 项 时 , 方程 才 可 能 存在 整数 解 。 

室 间 分 划 约 束 。 为 了 并 行 化 一 个 循环 吝 套 结构 的 执行 过 程 ; 我 们 需要 把 这 个 循环 的 迭代 
映射 到 一 个 处 理 器 空间 。 这 个 处 理 器 空间 可 能 具有 一 个 或 多 个 维度 。 空 间 分 划 约 束 是 说 
如 果 不 同 迭代 中 的 两 个 访问 之 间 具 有 数据 依赖 关系 ( 即 它们 访问 了 同一 个 数据 元 素 ), AB 
么 它们 必须 被 映射 到 同一 个 处 理 器 上 。 只 要 这 个 从 和 迭代 到 处 理 器 的 映射 是 仿 射 的 , 我 们 
就 可 以 把 这 个 问题 用 矩阵 -向量 的 方式 表示 出 来 。 

基本 代码 转换 。 用 来 并 行 化 具有 仿 射 数组 访问 的 程序 的 转换 是 七 个 基本 转换 的 组 合 , 它 
们 是 : 循环 融合 、 循环 裂变 、 重 新 索引 (给 循环 下 标 加 上 一 个 常量 )、 比 例 变换 (将 循环 下 
标 乘 以 一 个 常量 ) 、 反 置 (倒转 一 个 循环 的 下 标 )、 交 换 ( 交 换 循环 的 顺序 ) 和 倾斜 (改写 循 
环 使 得 迭代 空间 中 的 扫描 线 不 再 和 某 个 坐标 轴 同 向 ) 。 

并 行 运算 的 同步 。 有 时 ， 如 果 我 们 在 一 个 程序 的 步骤 之 间 插 入 同步 运算 ， 就 可 以 获得 更 
多 的 并 行 性 。 比 如 , 相 邻 的 两 个 循环 嵌 套 结构 之 间 可 能 具有 数据 依赖 关系 , 但 是 在 这 两 
个 循环 之 间 的 同步 运算 可 以 使 得 各 个 循环 被 单独 并 行 化 。 

流水 线 化 。 这 个 并 行 化 技术 允许 处 理 器 共享 数据 , 方法 是 把 某 些 数据 (通常 是 数组 元 素 ) 
从 一 个 处 理 器 同步 传递 到 处 理 器 空间 中 的 相 邻 的 处 理 器 。 这 个 方法 可 以 提高 每 个 处 理 带 
所 访问 数据 的 局 部 性 。 

时 间 分 划 约 束 。 为 了 找到 流水 线 化 的 机 会 ,我 们 要 求 出 时 间 分 划 约 束 的 解 。 这 些 约束 是 
说 只 要 两 个 数组 访问 会 触及 同一 个 数组 元 素 , 那么 在 此 流水 线 中 , 首先 发 生 的 迭代 中 的 
访问 所 分 配 到 的 流水 线 阶段 不 得 晚 于 第 二 个 访问 所 分 配 的 流水 线 阶段 。 
求解 时 间 分 划 约 束 5 Farkas 引 理 提供 了 一 个 有 力 的 求解 技术 。 它 可 以 找 出 一 个 带 有 数组 
访问 的 给 定 循 环 找 套 结构 所 人 允许 的 所 有 仿 射 时 间 分 划 映 射 。 这 个 技术 实质 上 是 把 原来 的 
表达 时 间 分 划 约 束 的 线性 不 等 式 公式 替换 成 为 它 的 对 偶 系统 。 

分 央 。 这 个 技术 把 一 个 循环 媒 套 结构 中 的 每 个 循环 都 分 割 成 为 两 个 循环 。 这 个 技术 的 优 
点 在 于 可 以 使 得 我 们 在 一 个 多 维 数组 的 小 段 ( 块 ) 上 进行 计算 , 每 次 处 理 一 个 块 。 这 么 做 
提高 了 程序 的 局 部 性 , 使 处 理 单个 块 时 需要 的 数据 都 在 高 速 缓存 中 。 

条 状 挖 据 。 和 分 块 技术 类 似 , 这 个 技术 只 把 一 个 循环 钼 套 结构 中 的 一 部 分 循环 分 解 开 ， 
每 个 循环 分 成 两 个 循环 。 这 么 做 的 好 处 是 一 个 多 维 数组 被 一 条 一 条 地 访问 , 从 而 得 到 最 
好 的 高 速 缓存 利用 率 。 
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第 12 章 ， 过 程 间 分 析 


在 这 一 章 中 , 我 们 讨论 一 些 不 能 使 用 过 程 内 分 析 技 术 解决 的 优化 问题 ,由 此 引 出 了 过 程 间 分 
析 的 重要 性 。 我 们 将 首先 描述 过 程 间 分 析 的 常见 形式 ,并 解释 实现 它们 的 难点 。 然后 将 描述 过 
程 间 分 析 的 应 用 。 对 于 诸如 C 和 Java 这 样 广泛 使 用 的 程序 设计 语言 ， 指针 别名 分 析 是 所 有 过 程 
间 分 析 技 术 的 关键 之 处 。 因 此 本 章 将 用 大 量 篇 幅 讨论 获取 程序 中 的 指针 别名 信息 所 需要 的 技术 。 
我 们 先 给 出 Datalog 的 描述 , 这 种 表示 方法 极 大 地 隐藏 了 一 个 高 效 指针 分 析 技 术 的 复杂 性 。 然后 
我 们 描述 一 个 用 于 指针 别名 分 析 的 算法 , 并 说 明 如 何 使 用 三 分 决策 图 ( Binary Decision Diagram, 
BDD) 来 高 效 地 实现 这 个 算法 。 

大 部 分 编译 器 优化 技术 , 包括 那些 在 第 9、10、11 章 中 描述 的 技术 , 都 是 每 次 在 一 个 过 程 中 
执行 的 。 我 们 把 这 样 的 分 析 称 为 过 程 内 分 析 。 这 些 分 析 保守 地 假设 被 调用 的 过 程 有 可 能 改变 过 
程 可 见 的 所 有 变量 的 状态 , 并 且 它 们 还 可 能 产生 某 种 副作用 ， 比 如 改变 此 过 程 可 见 的 任何 变量 的 
(i, 或 产生 导致 调用 栈 释放 的 异常 。 因 此 ,过程 内 分 析 虽 然 不 精确 ,但 是 却 相对 简单 。 有 些 优化 
不 需要 过 程 间 分 析 , 而 有 些 优化 不 借助 过 程 间 分 析 几 乎 不 会 产生 有 用 的 信息 。 

一 个 过 程 间 分 析 处 理 的 是 整个 程序 , 它 将 信息 从 调用 者 传送 到 被 调用 者 , 或 者 反 向 传送 。 一 
个 相对 简单 但 有 用 的 技术 是 过 程 内 联 (inline), 就 是 把 一 个 过 程 调用 蔡 换 为 被 调用 过 程 的 过 程 体 。 
在 替换 时 需要 考虑 参数 传递 和 返回 值 , 因此 需要 进行 适当 修改 。 只 有 当 我 们 知道 这 个 过 程 调用 
的 目标 后 才 可 以 应 用 这 个 方法 。 

如 果 过 程 是 通过 一 个 指针 或 面向 对 象 编程 中 常见 的 过 程 分 发 机 制 间接 调用 的 ,那么 对 程序 
指针 或 引用 的 分 析 有 时 可 以 确定 这 个 间接 调用 的 目标 。 如 果 目 标 是 唯一 的 ,那么 就 可 以 应 用 过 
程 内 联 方法 。 

即使 确定 了 每 个 过 程 调 用 只 有 一 个 调用 目标 , 仍然 必须 谨慎 使 用 内 联 转换 。 一 般 来 说 , 不 可 
能 直接 内 联 递 归 的 过 程 , 并 且 即 使 没有 递归 , 内 联 转换 也 可 能 指数 级 地 增加 代码 的 大 小 。 


12.1 基本 概念 


在 本 节 中 ，, 我 们 将 介绍 调用 图 , 就 是 告诉 我 们 哪个 过 程 调 用 了 哪个 过 程 的 图 。 我 们 也 会 介绍 
“上 下 文 相关 ”的 思想 , 即 进行 数据 流 分 析 时 需要 认识 到 过 程 调用 的 序列 是 什么 。 也 就 是 说 ， 当 
上 下 文 相关 分 析 在 区 分 程序 中 的 不 同 “位 置 " 时 , 它 不 仅 考虑 当前 的 程序 点 ,还 考虑 当前 栈 中 的 
活动 记录 的 序列 (或 其 大 纲 )。 
12. 1.1 调用 图 

一 个 程序 的 调用 图 (call graph) 是 一 个 结 点 和 边 的 集合 , 并 满足 

1) 对 程序 中 的 每 个 过 程 都 有 一 个 结 点 。 

2) 对 于 每 个 调用 点 (call site) 都 有 一 个 结 点 。 所 谓 调用 点 就 是 程序 中 调用 某 个 过 程 的 一 个 
位 置 。 

3) 如 果 调 用 点 < 调用 了 过 程 p, 就 存在 一 条 从 < 的 结 点 到 p 的 结 点 的 边 。 

很 多 用 诸如 C 或 Fortran 语言 编写 的 程序 直接 进行 过 程 调 用 , 因此 每 个 调用 的 调用 目标 可 以 
静态 地 确定 。 在 这 种 情况 下 , 调用 图 中 的 每 个 调用 点 都 恰好 有 一 条 边 指向 一 个 过 程 。 但 是 ， 如 采 
程序 使 用 了 过 程 参数 或 函数 指针 , 一 般 来 说 , 需要 到 程序 运行 时 刻 才能 知道 调用 目标 , 而 且 实 际 
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上 可 能 各 次 调用 的 目标 都 有 所 不 同 。 那 么 , 一 个 调用 点 可 能 连接 到 调用 图 中 的 多 个 甚至 所 有 的 
过 程 。 

对 于 面向 对 象 程序 设计 语言 来 说 , 间接 调用 是 标准 的 调用 方式 。 特 别 地 ， 当 存在 子 类 对 方法 
进行 重 载 的 情况 时 , 对 方法 丈 的 使 用 可 能 指向 多 个 不 同方 法 中 的 任意 一 个 , 这 要 取决 于 该 调用 所 
作用 的 接收 对 象 的 子 类 。 使 用 这 样 的 虚 (virtual) 方 法 调用 意味 着 我 们 需要 知道 接收 者 的 类 型 之 后 
才 可 以 确定 调用 了 哪个 方法 。 

EPR 图 12-1 昌 示 了 一 个 C 程 序 。 该 程序 声明 pf 是 
一 个 指向 类 型 为 “整数 到 整数 ”的 函数 的 全 局 指针 。 有 两 个 


int (*pf) (int); 


int funi(int x) { 


函数 funi 和 fun2 是 这 个 类 型 。 此 外 ,main MAA if (x < 10) 
pf 所 指向 的 类 型 。 图 中 显示 了 三 个 调用 点 , 标记 为 c1、 ; eee aig (apt) Cant) 3 
c2 Fl c3 , 这 些 标号 不 是 程序 的 一 部 分 。 return x; 
最 简单 的 对 pf 可 能 指向 哪个 函数 的 分 析 只 查看 函数 
的 类 型 。 函 数 funl 及 fun2 Apt 所 指向 的 对 象 具有 相同 int fun2(int y) { 
的 类 型 , 而 main 则 不 同 。 因 此 , 一 个 保守 的 调用 图 如 图 | o. os 
12-2a 所 示 。 对 这 个 程序 进行 更 深入 的 分 析 , 就 可 以 观察 到 } 
pf {E main 中 指向 fun2, 而 在 fun2 中 指向 fun1。 但 是 enO T 
没有 其 他 的 对 任何 指针 的 赋值 , 因此 pf 不 可 能 指向 main ; pf = &fun2; 


(*pf) (5) ; 


函数 。 这 个 推理 过 程 产生 的 调用 图 和 图 12.2a 中 的 相同 。 
一 个 更 加 精确 的 分 析 将 指出 pf 在 c3 上 只 可 能 指向 
fun2, 因为 紧 靠 这 个 调用 之 前 的 赋值 语句 将 fun 赋 给 “图 12-1 一 个 具有 画 数 指针 的 程序 
pf. XMH, pf 在 c2 处 只 可 能 指向 funl, 分析 的 结果 是 , 对 fun1 的 第 一 次 调用 必然 是 
fun2 做 出 的 , H funi 不 会 改变 pf 的 值 , 因此 
当 我 们 在 fund 中 时 ,pf 就 指向 funl 。 特 别 地 ， (< 二 (eon Om sum) 
我 们 可 以 确信 pf 在 cl 处 指向 funl, Auk, 图 A 
12-2b 是 一 个 更 加 精确 、 正 确 的 调用 图 。 口 
一 般 来 说 ， 当 出 现 了 对 函数 或 方法 的 引用 或 (<2) AC enna) (c2) C 
指针 时 , 要 求 我 们 对 所 有 过 程 参数 、 指 针 、 接 收 对 
象 类 型 等 的 可 能 取 值 进行 静态 估计 。 要 得 到 一 个 
精确 的 估计 值 就 必须 进行 过 程 闻 分析。 这 个 分 析 (<3) (<3) 
从 可 以 静态 观察 到 的 目标 开始 ,迭代 地 进行 。 当 a) b) 
发 现 一 个 新 的 调用 目标 时 ,分析 过 程 就 会 把 一 条 Lr 
新 边 加 入 到 调用 图 中 , 并 不 断 寻 找 更 多 的 目标 ， PETA AE R 
直到 收敛 。 
12.1.2 Ric 
过 程 间 分 析 很 具有 挑战 性 ,因为 各 个 过 程 的 行为 和 它 被 调用 时 所 在 的 上 下 文 相 关 。 例 12. 2 
通过 一 个 小 程序 上 的 过 程 间 常 量 传播 问题 说 明了 上 下 文 的 重要 性 。 
ERE 28123 中 的 程序 片段 。 函 数 /在 三 个 调用 点 cl 、c2 和 c3 上 被 调用 。 在 循环 的 
每 次 迭代 中 ,常量 0 在 cl 上 被 作为 实在 参数 传递 , 而 常量 243 在 c2 和 c3 上 被 传递 , 这 些 调用 
分 别 返 回 常量 1 和 244。 因 此, 在 各 个 上 下 文中 函数 £ 的 实在 参数 都 是 常量 , 但 是 常量 的 具体 什 
要 根据 上 下 文 而 定 。 
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如 我 们 将 看 到 的 ,除非 我 们 能 够 知道 在 上 下 文 cl 中 调 | 
eri 





用 f 时 返回 1， 且 在 其 他 两 个 上 下 文中 调用 f 时 返回 244, S m a 7 Hee 
则 不 可 能 指出 t1、t2 和 t3 都 被 赋予 了 一 一 个 常量 值 (因此 | es: £3 = £(243); 
X[ 让 也 被 赋予 了 常量 值 )。 eg :| Kit = th pee+tss 
对 f 的 各 次 调用 的 返回 值 可 能 是 1 或 244。 
二 种 非常 简单 但 是 极端 不 精确 af lan Ra ine pen Eog 
上 上 下文 无 关 分 析 (context-insensitive analysis) 。 它 把 每 个 调用 } prad 








和 返回 语句 看 作 一 个 “goto" 操 作 。 我 们 创建 一 个 超级 控制 流 
图 。 图 中 除了 一 般 的 过 程 内 控制 流 边 外 还 有 一些 附加 的 边 。 图 123， 用 来 说 明 上 下 文 相关 分 析 
REHU 的 需求 的 一 个 程序 片断 

1) 从 每 个 调用 点 到 它 所 调用 的 过 程 的 开始 处 的 边 。 

2) 从 返回 语句 回 到 调用 点 的 边 9。 

另外 还 增加 了 一 些 赋值 语句 ,它们 把 实在 参数 赋 给 相应 的 形式 参数 ; 并 把 返回 值 赋 给 接收 返 
回 结果 的 变量 。 然 后 , 我 们 就 可 以 对 这 个 超级 控制 流 图 应 用 那些 为 分 析 单 个 过 程 而 设计 的 标准 
分 析 技术 , 找 出 上 下 文 无 关 的 过 程 间 分 析 结果 。 这 个 模型 虽然 简单 ,但 它 抽象 掉 了 过 程 调用 中 输 
入 值 和 输出 值 之 间 的 重要 关系 , 使 得 分 析 结果 不 够 精确 。 
图 12.3 中 的 程序 的 超级 控制 流 图 显示 在 图 12-4 中 。 块 B6 就 是 函数 万 HRB, 包含 了 
调用 点 cl, 它 把 形式 参数 设置 为 0, 然后 跳 转 到 /的 开始 处 。 类 似 地 ,Bs 和 Bs 分 别 表示 调用 
点 c2 和 c3。B 可 以 从 f( 基 本 块 B4) 的 结尾 处 到 达 。 我 们 在 By 中 把 1 的 返回 值 赋 给 tlo BE 
把 形式 参数 v 设置 成 243 并 通过 跳 转 到 By 再 次 调用 f。 请 注意 , 没有 从 By BGA By 的 边 。 在 从 Bs 
到 达 B 的 路 上 ， 控制 流 必须 穿越 f。 










t3 = retval 
tA = titt? 
t5 = t4+t3 
xiij = 25 
i = itl 





By 





tl = retval 
c2: v = 243 












t2 = retval 
c3: v = 243 















E 12-4 Kl 12-3 的 控制 流 图 , 它 把 函数 调用 当 作 控制 流 处 理 





O 实际 上 是 从 返回 语句 到 跟 在 调用 点 之 后 的 指令 的 边 。 
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B, 和 By 类 似 。 它 接收 来 自 的 返回 值 并 把 返回 值 赋 给 t2， 并 初始 化 对 了 的 第 三 次 调用 。 志 
B, 表示 了 第 三 次 调用 的 返回 和 对 X[ 订 的 赋值 。 

如 果 我 们 把 图 12-4 当 作 单个 过 程 的 流 图 , 那么 可 以 断定 当 控 制 流 进入 Be 时 ,wv 的 值 可 以 是 0 
或 243。 因 此 , 我 们 最 多 能 够 断定 retval 的 值 是 1 或 244; 而 不 会 是 其 他 值 。 类 似 地 , 关于 t1、 
t2 和 t3, 我 们 只 能 断定 它们 的 值 是 1 或 244。 因 此 , AEK Xil WHEN 3, 246, 489 a} 732 之 
一 。 反 过 来 ,一 个 上 下 文 相关 分 析 可 以 区 分 每 次 调用 上 下 文 的 结果 ,并 产生 例 12.2 中 描述 的 直 
觉 结果 : tl 总 是 1, t2 和 t3 的 值 总 是 244, 而 X[ 引 的 值 为 489。 口 
12.1.3 调用 串 

在 例 12. 2 中 , 我 们 只 需要 知道 调用 过 程 / 的 调用 点 就 可 以 区 分 不 同 的 上 下 文 。 一 般 情况 下 ， 
一 个 调用 上 下 文 是 通过 整 不 调用 栈 中 的 内 容 来 定义 的 。 我 们 把 栈 中 各 个 调用 点 组 成 的 串 称 为 调 
FA # (call string) 。 
图 12-5 是 对 图 12-3 进行 细微 的 修改 后 得 到 的 。 这 里 我 们 把 对 了 的 调用 替换 成 对 g 的 
调用 。 函 数 8 随后 用 同样 的 参数 调用 /。 函 数 g 调用 /的 地 点 是 c4, 这 是 一 个 新 增 的 调用 点 。 

有 三 个 对 应 于 f 的 调用 串 : (c1, c4), (c2, c4) 和 (c3,c4)。 如 我 们 在 这 个 例子 中 见 到 
的 , 函数 /中 w 的 值 并 不 由 调用 串 中 的 直接 (或 者 说 最 后 ) 调 用 点 c4 决定 。 这 些 常 量 值 实际 上 是 
由 每 个 调用 串 中 的 第 一 个 元 素 决定 的 。 口 

例 12. 4 表明 ; 与 分 析 相关 的 信息 可 能 在 调用 链 的 早期 就 被 引入 。 事 实 上 ,如 例 12.5 所 示 ， 
为 了 得 到 最 精确 的 答案 , 有 时 甚至 需要 考虑 计算 整个 调用 串 。 
这 个 例子 说 明了 对 不 限 长 度 的 调用 串 的 分 析 能 力 是 如 何 产生 出 更 加 精确 的 结果 的 。 
在 图 12-6 中 , 我 们 看 到 如 果 用 二 个 正 数 值 来 调用 g, g 将 会 被 递归 地 调用 c。 次 。 每 次 & 被 调用 
的 时 候 , 它 的 参数 o 的 值 减 一 。 因 此 , 在 调用 串 为 c2(c4)" 的 上 下 文中 , g 的 参数 ， 的 值 是 
243 -n WIE, g 的 功能 就 是 把 0 或 任何 负 参 数 加 一 , 并 对 任何 大 于 等 于 1 的 参数 返回 2。 















fou ki 0; i < ny itt) { 


et: tl = g(0); 
c2: t2 = g(243); 
for (i = 0; i <n; i++) { c3: t3 = g(243); 
ti = g(0); X[i] = t1+t2+t3; 
t2 = g(243); } 


t3 = g(243); 
X[i] = t1+t2+t3; 


int g (int v) { 





} if (v>1)f{ 
c4: return g(v-1); 
int g (int v) { } else { 
return f(v); Ch return f(v); 


} } 





int f (int v) { 
return (v+1); 


int f (int v) { 
return (v+1); 


} 





} 





图 12-5 演示 调用 串 的 程序 片段 图 12-6 需要 分 析 整 个 调用 串 的 递归 程序 


函数 上 有 三 个 可 能 的 调用 串 。 如 果 我 们 从 cl 处 的 调用 开始 , 那么 g 可 以 立刻 调用 f, 因此 (cl， 
c5 ) 就 是 这 样 的 一 个 串 。 如 果 我 们 从 c2 或 c3 开始 , 那么 我 们 共 调 用 & 243 次 , 然后 再 调用 f。 这 些 调 
用 串 是 (c2, c4, c4,…, c5) 和 (c3, c4, c4,…, c5), 在 这 两 种 情况 下 的 序列 中 都 有 242 个 c4。 在 
这 些 上 下 文中 , 在 第 一 个 上 下 文中 f 的 参数 v 的 值 是 0, 而 在 另外 两 个 中 的 参数 值 为 1。 Oo 
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在 设计 一 个 上 下 文 相关 分 析 的 时 候 , 我 们 可 以 选择 不 同 的 精确 度 。 比 如 , 我 们 可 以 选择 只 使 
用 调用 串 中 最 直接 的 上 个 调用 点 来 区 分 上 下 文 ， 而 不 是 使 用 整个 调用 串 来 提高 分 析 结果 的 质量 。 
这 个 技术 被 称 为 万 界 限 上 下 文 分 析 技术 。 上 下 文 无 关 分 析 就 是 上 - 界限 上 下 文 分 析 技术 在 上 =0 
时 的 特例 。 我 们 可 以 使 用 1- 界限 分 析 技术 找 出 例 12. 2 中 的 所 有 常量 , 用 2- 界 限 分 析 技 术 找 出 例 
12. 4 中 的 所 有 常量 。 但 是 , 只 要 例 12. 5 中 的 常量 243 被 替换 成 为 不 同 的 任意 大 小 的 常量 值 ， 没 
有 任何 所 界限 分 析 可 以 找 出 该 例 中 的 所 有 常量 。 

如 果 不 选 定 一 个 固定 的 不 值 , 另 一 种 可 行 方法 是 对 所 有 无 环 调 用 串 进行 完全 的 上 下 文 相关 分 
析 。 所 谓 无 环 调用 串 就 是 不 包含 递归 环 的 调用 串 。 对 于 所 有 带 有 递归 的 调用 串 ， 我 们 可 以 把 所 
有 的 递归 环 都 塌 缩 成 一 个 点 ,以 便 限定 需要 分 析 的 不 同上 下 文 的 数目 。 在 例 12. 5 中 ,从 调用 点 
c2 开始 的 调用 可 以 用 调用 串 (c2 ，c4 * ，c5 ) 近 似 地 表示 。 请 注意 , 使 用 这 种 方案 时 ， 即 使 对 于 
不 带 递归 的 程序 , 不 同调 用 上 下 文 的 数目 和 程序 中 的 过 程 数目 呈 指 数 关系 。 

12.1.4 ”基于 克隆 的 上 下 文 相关 分 析 

上 下 文 相 关 分 析 的 另 一 个 方法 是 在 概念 上 克隆 被 调用 过 程 ， 对 于 每 个 感 兴趣 的 上 下 文 都 进 
行 一 次 克隆 。 然 后 我 们 就 可 以 对 克隆 过 的 调用 图 应 用 上 下 文 无 关 分 析 。 例 12.6 和 12.7 分 别 给 
出 了 和 例 12. 4 和 12. 5 等 价 的 克隆 版 本 。 在 实际 分 析 时 ,我 们 不 需要 真 的 克隆 代码 , 而 是 可 以 直 
接 使 用 一 个 高 效 的 内 部 表示 来 眼 踪 各 个 克隆 部 分 的 分 析 结 果 。 

DEJ 612-5 的 克隆 版 本 显示 在 图 12-7 中 。 因 为 每 个 调用 上 下 文 指向 一 个 不 同 的 克隆 , 因此 不 
存在 混淆 的 情况 。 比 如 ,gl 的 输入 为 0, 产生 输出 1; 92 和 g3 接受 输入 243 并 产生 输出 24。 oO 




















ftor G SO ai <m, ty et 
cl: tl = gi(0); 

c2: t2 = g2(243); 

(28 t3 = g3(243); 

Xli] = ti+t2+t3; 


} 

int g1 (int v) { 
c4.1: return f1(v); 

} 

int g2 (int v) { 
c4.2: return f£2(v); 

} 

int g3 (int v) { 
c4.3: return f£3(v); 

i 


int f1 (int v) { 
return (v+1); 


intif?, Gaty) of 
return (v+1); 





int £3 (int v) { 
return (v+1); 


图 12-7 图 12-5 的 克隆 版 本 


CEREA 例 12.5 的 克隆 版 本 显示 在 图 12-8 中 。 我们 创建 了 过 程 8 的 一 个 克隆 版 本 , CREN 
有 首先 在 c1、c2 和 c3 处 调用 的 g 的 实例 。 在 这 种 情况 下 , 如 果 一 个 分 析 技 术 能 够 从 v=0 推导 


578 第 12 章 





出 vz>1 不 成 立 , 那么 该 分 析 将 会 确定 在 调用 点 cl 处 的 调用 将 会 返回 1。 但是, 这 个 分 析 不 能 很 





好 地 处 理 递归 , 不 能 分 析 得 到 调用 点 c2 和 c3 处 的 常量 值 。 O 
[ for (i = 0; i <n; i++) { 
el: tl = gi(0); 
C2: t2 = g2(243); 
c3: t3 = g3(243); 
X[i] = t1+t2+t3; 
} 
int gi (int v) { 
if wS D'{ 
c4.1: return gi(v-1); 
} else {* 
eh st: return f1(v);} 
} 
inti g2 (nt v) { 
if (void) { 
c4.2: return g2(v-1); 
} else { 
E92 return f2(v);} 
} 
int g3 (int v) { 
df (Wy 1), £ 
c4.3: return g3(v-1); 
} else { 
cb.3: return £3(v) ;} 


} 


int f1 (int v) { 
return (v+t1); 


int f2 (int v) { 
return (v+1); 


} 
int foire wv) { 


return (v+1); 
We } 


Al 12-8 图 12-6 的 克隆 版 本 








12.1.5 基于 摘要 的 上 下 文 相关 分 析 

基于 摘要 的 过 程 间 分 析 是 基于 区 域 的 分 析 技 术 的 扩展 。 基 本 上 , 在 一 个 基于 摘要 的 分 析 中 ， 
每 个 过 程 使 用 一 个 简洁 的 描述 (摘要 ) 来 刻 划 。 这 个 描述 包含 这 个 过 程 的 某 些 可 观察 行为 。 摘 要 
的 主要 目的 是 避免 在 每 个 可 能 调用 某 过 程 的 调用 点 上 都 重复 分 析 该 过 程 的 过 程 体 。 

让 我 们 首先 考虑 没有 递归 的 情况 。 每 个 过 程 被 建 模 为 只 有 一 个 人 口 点 的 区 域 。 每 对 调用 
者 -被 调用 者 之 间 具 有 类 似 于 外 层 区 域 - 内 层 区 域 的 关系 。 和 过 程 内 分 析 的 唯一 不 同 在 于 , 在 
过 程 间 分 析 时 ,一 个 过 程 区 域 可 能 嵌 套 在 多 个 不 同 的 外 层 区 域 中 。 

这 个 分 析 由 两 部 分 组 成 : 

1) 一 个 自 底 向 上 的 阶段 , 它 为 每 个 过 程 计算 出 一 个 总 结 该 过 程 的 效果 的 传递 函数 。 

2) 一 个 自 项 向 下 的 阶段 , 它 传播 和 调用 者 有 关 的 信息 , 计算 出 被 调用 者 的 结果 。 

为 了 得 到 完全 上 下 文 相关 的 结果 , 来 自 不 同调 用 上 下 文 的 信息 必须 被 单独 传递 到 被 调用 者 。 
如 果 和 希望 计算 过 程 更 高 效 , 但 是 允许 相对 的 不 精确 性 ， 那么 也 可 以 使 用 一 个 交 函 数 合并 来 自 各 个 
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调用 者 的 信息 , 然后 再 向 下 传播 到 被 调用 者 。 

EERI GRR, 每 个 过 程 都 使 用 一 个 传递 函数 作为 其 摘要 ,该 传递 函数 描述 了 过 程 
是 如 何 通过 它 的 过 程 体 传播 常量 的 。 在 例子 12.2 中 , 我 们 可 以 把 总结 为 如 下 的 函数 : 如 果 把 一 
个 常量 c。 作 为 v 的 实在 参数 , 那么 该 函数 返回 常量 + 1。 基 于 这 个 信息 ， 这 个 分 析 过 程 将 确定 
£1. t2 和 t3 分 别 具 有 常量 值 1、244 和 244。 请 注意 , 这 个 分 析 过 程 并 没有 因为 不 可 实现 的 调用 


串 而 产生 不 精确 的 结果 。 


回忆 一 下 , 例子 12.4 扩展 了 例子 12. 2, 增加 了 一 个 函数 g 来 调用 f。 因 此 我 们 可 以 得 出 结论 , g 的 
传递 函数 和 上 的 传递 函数 是 相同 的 。 我 们 仍然 可 以 确定 tL、t2 和 t3 分 别 具 有 常量 值 1、24 和 244。 


现在 让 我 们 考虑 例子 12. 2 中 函数 内 的 参数 v 的 值 是 什 
么 。 最 初 考虑 时 , 我 们 可 以 把 所 有 调用 上 下 文 的 结果 组 合 在 
一 起 。 因 为 z 的 值 可 以 是 0 或 者 243, 所 以 可 以 简单 地 确定 " 
不 是 一 个 常量 。 这 个 结论 是 合理 的 , 因为 没有 哪个 常量 可 以 
PRIS PH vo 

如 果 我 们 希望 得 到 更 加 精确 的 结果 , 那么 可 以 为 感 兴趣 
的 上 下 文 计 算 特 定 值 。 必 须 把 信息 从 我 们 感 兴趣 的 上 下 文 
向 下 传递 ,以 确定 和 这 个 上 下 文 相关 的 答案 。 这 个 步骤 和 基 
于 区 域 的 分 析 中 的 自 顶 向 下 过 程 类 似 。 比 如 , "在 调用 点 c1 
处 的 值 为 0, 而 它 在 调用 点 c2 和 c3 处 的 值 为 243。 为 了 利 


for (i = 0; i < n; i++) { 
ti = £000); 
t2 = £243(243); 
t3 = £243(243); 
X[i] = t1+t2+t3; 


} 


int fO (int v) { 
return (1); 


} 


int £243 (int v) {€ 
return (244); 
} 





用 /内 部 的 常量 传播 性 质 ,我们 需要 创建 两 个 克隆 来 表示 这 

两 者 的 不 同 ,第 个 克隆 是 针对 输 信 值 0 的 特例 ,而 后 “人 在。 图 122 Sereno es 

克隆 是 针对 输入 值 243 的 特例 , 如 图 12-9 所 示 。 Che ee ae 
通过 例子 12.8, 最 后 我 们 看 到 如 果 希 望 在 不 同 的 上 下 文中 以 不 同 的 方式 编译 代码 , 仍然 需要 

克隆 代码 。 本 方法 和 基于 克隆 的 方法 的 不 同 之 处 在 于 后 者 在 分 析 之 前 就 需要 根据 调用 串 进行 克 

隆 。 在 基于 摘要 的 方法 中 , 克隆 是 在 分 析 之 后 ,以 分 析 结 

果 为 基础 进行 克隆 。 即 使 没有 进行 克隆 , 在 基于 摘要 的 方 | int (+p) (int); 

法 中 关于 一 个 被 调用 过 程 的 运行 效果 的 推理 结果 也 是 精确 | “i 

的 ， 不 会 出 现 不 可 实现 路 径 的 问题 。 


int fant i) 4 


除了 克隆 一 个 函数 ,我 们 也 可 以 对 代码 进行 内 联 处 理 。 aar o as 
内 联 的 另 一 个 效果 是 消除 了 过 程 调用 的 开销 。 else 


{p = &f; return (*p) (i);} 


我 们 可 以 用 计算 不 动 点 解 的 方法 来 处 理 递归 。 当 出 现 | 1 
递归 时 , 我 们 首先 找 出 调用 图 中 的 强 连 通 分 量 。 在 自 底 向 


int g(int j) { 





上 阶段 , 只 有 当 一 个 强 连通 分 量 的 所 有 后 继 都 已 经 被 访问 ERO 二 
之 后 我 们 才 访问 这 个 分 量 。 对 于 一 个 非 平凡 的 强 连通 分 re pn ENR S 
B, 我 们 迭代 地 为 该 分 量 中 的 每 个 过 程 计算 传递 函数 , 直 {q = tg; return (+q) (j);} 
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递 函数 , 直到 它们 不 再 发 生 改 变 为 止 。 
12. 1.6 12. 1 节 的 练习 

练习 12.1.1; 图 12-10 中 是 一 个 带 有 两 个 函数 指针 p 
F q 的 C 程 序 。N 是 常量 , 它 可 能 比 10 小 也 可 能 比 10 大。 
请 注意 , 这 个 程序 会 产生 无 穷 的 过 程 调用 序列 , 但 是 这 和 





void main() { 
p = &f; 





q = &g; 
(xp) ((*q) (N)); 





图 12-10 练习 12.1.1 的 程序 
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我 们 当前 考虑 这 个 问题 的 目的 无 关 。 

1) 找 出 本 程序 中 的 所 有 调用 点 。 

2) 对 于 每 个 调用 点 , p 可 能 指向 哪些 函数 ? q 可 能 指向 哪些 函数 ? 

3) 画 出 这 个 程序 的 调用 图 。 

4) HRSA g 的 所 有 调用 串 。 

练习 12. 1.2: 图 12-11 中 有 一 个 函数 id, 这 个 函数 
是 一 个 “单位 函数 ”。 它 的 返回 值 就 是 传递 给 它 的 参数 
值 。 图 中 还 有 一 个 代码 片段 , 该 片段 包含 一 个 分 支 语句 ， 
后 面 跟随 一 个 计算 *+y 的 和 的 赋值 语 名。 else {x = id(3); y = id(2); } 

1) 检查 这 个 代码 , 关于 z 在 结尾 处 的 值 , 我 们 可 以 |“ sa 
有 哪些 结论 ? 

2) 把 对 id 的 调用 当 作 控制 流 处 理 , 为 这 个 代码 片 ， 图 12-11 练习 12.1.2 的 代码 片断 
段 构造 流 图 。 

3) 如 果 我 们 对 问题 2 中 得 到 的 流 图 应 用 9.4 节 中 描述 的 常量 传播 分 析 , 可 以 确定 哪些 常 
量 值 ? 

4) 图 12-11 中 的 全 部 调用 点 是 哪些 ? 

5) 共有 哪些 调用 了 id 的 上 下 文 ? 

6) 改写 图 12211 中 的 代码 , 为 每 一 个 调用 id 的 上 下 文 克隆 一 个 函数 id 的 新 版 本 。 

7) 把 对 ia 的 调用 作为 控制 流 处 理 , 构造 你 在 问题 6 中 得 到 的 代码 的 流 图 。 

8) 对 于 在 问题 7 中 得 到 的 流 图 进行 常量 传播 分 析 。 现 在 可 以 确定 哪些 常量 值 ? 


12.2 为 什么 需要 过 程 间 分 析 


我 们 已 经 说 明了 过 程 间 分 析 有 多么 困难 , 现在 让 我 们 来 解决 一 个 重要 的 问题 : 我 们 为 什么 以 
及 希望 在 什么 时 候 使 用 过 程 间 分 析 。 虽 然 我 们 使 用 常量 传播 的 例子 来 演示 过 程 间 分 析 , 但 这 个 
过 程 间 优 化 技术 并 不 是 容易 使 用 的 ， 而 且 进 行 这 个 分 析 也 没有 什么 特别 的 好 处 。 仅 仅 通 过 过 程 
内 分 析 和 把 最 频繁 执行 的 代码 段 中 的 过 程 调用 进行 内 联 处 理 ,就 可 以 获得 常量 传播 的 大 部 分 
好 处 。 

但 是 , 有 很 多 理由 可 以 说 明 为 什么 过 程 间 调用 是 非常 重要 的 。 下 面 我 们 描述 过 程 间 分 析 的 
几 个 重要 应 用 。 
12.2.1 虚 方法 调用 

上 面 提 到 过 , 面向 对 象 程序 有 很 多 小 的 方法 。 如 果 我 们 每 次 只 对 一 个 方法 进行 优化 , 那么 只 
能 找到 很 少 的 优化 机 会 。 对 方法 调用 进行 解析 就 可 以 促成 更 多 的 优化 。 像 Java 这 样 的 程序 设计 
语言 动态 地 载 人 它 的 类 。 结 果 , 我 们 在 编译 时 刻 不 知 道 在 x. m( ) 这样 的 调用 中 对 m 的 茶 次 使 用 
到 底 指向 (可 能 的 ) 多 个 名 为 m 的 方法 中 的 哪 一 个 。 

很 多 Java 语言 的 实现 使 用 了 一 个 即时 编译 器 , 在 运行 时 刻 对 它 的 字 节 码 进 行 编译 。 一 个 常 
见 的 优化 技术 是 找 出 程序 执行 的 剖面 图 ,并 确定 接收 对 象 通常 是 什么 类 型 。 然 后 , 我 们 可 以 把 调 
用 最 频繁 的 方法 内 联 到 调用 代码 中 。 相 应 的 代码 包含 了 对 这 个 类 型 的 动态 检查 ,如 果 运 行 时 刻 
的 接收 对 象 具 有 预期 的 类 型 就 执行 内 联 的 方法 。 

只 要 所 有 的 源 代码 都 在 编译 时 刻 可 用 , 我 们 就 可 以 使 用 男 一 种 方法 来 解析 对 方法 名 字 m 的 
使 用 。 然 后 , 可 以 进行 过 程 间 分 析 , 确定 对 和 象 类 型 。 如 果 变 量 % 的 类 型 是 唯一 的 , 那么 x. m( ) 的 
使 用 就 可 以 被 解析 。 我 们 明确 地 知道 在 这 个 上 下 文中 mm 指向 哪个 方法 。 在 这 种 情况 下 , 我们 可 





int id(int x) { return x;} 
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以 内 联 这 个 贡 的 代码 ,编译 器 甚至 不 需要 在 生成 的 代码 中 加 入 对 * 的 类 型 检查 代码 。 
12.2.2 指针 别名 分 析 

即使 我 们 不 想 执行 诸如 到 达 定 值 这 样 的 常见 数据 流 分 析 的 过 程 间 分 析 版 本 , 这 些 分 析 实 际 
二 也 可 以 从 过 程 间 指针 分 析 中 获 益 。 第 9 章 给 出 的 所 有 分 析 只 能 应 用 于 没有 别名 的 局 部 标量 变 
E RT, 指针 的 使 用 是 很 常见 的 , 在 像 C 这 样 的 语言 中 尤其 如 此 。 如 果 知 道 多 个 指针 是 否 可 能 
互 为 别名 ( 即 可 能 指向 同一 个 位 置 ), 我 们 就 可 以 提高 第 9 章 中 介绍 的 分 析 技术 的 精确 度 。 
EE 考虑 下 面 的 三 个 语句 组 成 的 序列 ,它们 可 能 组 成 了 一 个 基本 块 : 

e 

x = ep; 

如 果 不 知 道 p 和 4 是否 可 能 指向 同一 个 位 置 ,也 就 是 说 , 它们 是 否 可 能 互 为 别名 , 那么 就 不 
能 确定 x 在 基本 块 的 结尾 处 等 于 1。 B 
12.2.3 并行 化 

如 第 11 章 中 所 讨论 的 , 将 一 个 应 用 并 行 化 的 最 有 效 方法 是 寻找 最 粗 粒度 的 并 行 性 , 例如 在 
一 个 程序 的 最 外 层 循 环 中 找到 的 并 行 性 。 要 完成 这 个 任务 , 过程 间 分 析 技 术 是 非常 重要 的 。 标 
量 优化 ( 即 基于 简单 变量 的 值 的 优化 , 比如 第 9 章 中 讨论 的 技术 ) 和 并 行 化 之 间 有 很 大 的 不 同 。 
在 并 行 化 中 ,一 个 可 疑 的 数据 依赖 关系 就 可 能 使 得 整个 循环 不 可 并 行 化, 从 而 大 大 降低 优化 的 有 
效 性 。 这 种 对 不 精确 性 的 放大 在 标量 优化 中 是 看 不 到 的 。 在 标量 优化 中 , 我 们 只 需要 找 出 大 部 
分 优化 机 会 即 可 。 错 过 一 两 个 机 会 并 不 会 引起 很 大 的 不 同 。 
12.2.4 ”软件 错误 和 漏洞 的 检测 

过 程 间 分 析 不 仅仅 对 优化 代码 很 重要 。 同 样 的 技术 也 可 以 用 于 分 析 已 有 软件 , 寻找 各 种 纺 
码 错 误 。 这 些 错误 可 能 会 使 得 软件 变 得 不 可 靠 , 黑客 可 以 利用 这 些 错误 来 控制 或 毁坏 一 个 计算 
机 系统 。 计 算 机 系统 的 代码 错误 可 能 引起 严重 的 安全 漏洞 。 

静态 分 析 可 以 用 于 检测 是 否 存在 常见 的 多 种 错误 模式 。 比 如 , 一 个 数据 项 必须 用 一 个 锁 来 
保护 。 另 一 个 例子 是 , 在 操作 系统 中 屏蔽 一 个 中 断后 必须 随后 重新 启用 这 个 中 断 。 这 类 错误 的 
一 个 重要 源头 是 跨越 过 程 边界 的 代码 之 间 的 不 一 致 性 , 因此 过 程 间 分 析 极 为 重要 。PREfix 和 
Metal 是 两 个 实用 的 工具 , 它们 有 效 地 使 用 过 程 间 分 析 技术 在 大 型 程序 中 寻找 多 种 程序 错误 。 这 
类 工具 可 以 静态 地 找到 错误 , 从 而 大 大 提高 软件 可 靠 性 。 但 是 , 这些 工具 既 不 完全 也 不 健全 。 从 
这 个 意义 上 说 , 它们 不 能 找到 所 有 的 错误 , 并 且 不 是 报告 的 所 有 警告 都 是 错误 。 遗 憾 的 是 ,它们 
使 用 的 过 程 间 分 析 技术 相当 地 不 精确 , 如 果 让 这 些 工具 报告 所 有 可 能 的 错误 ， 大 量 的 假 报警 会 使 
得 工具 无 法 使 用 。 无 论 如 何 ; 虽然 这 些 工具 不 是 完美 的 , 但 它们 的 系统 化 使 用 已 经 表明 它们 能 够 
大 大 提高 软件 的 可 靠 性 。 

当 考虑 安全 缺陷 时 ;我 们 非常 期 望 找到 一 个 程序 中 所 有 可 能 的 错误 。 在 2006 年 , 黑客 使 用 
的 两 个 “最 流行 ”的 威胁 系统 完全 的 入 侵 形式 是 : 

1) Web 应 用 中 输入 确认 机 制 的 缺失 ; SOL 注入 是 这 种 攻击 最 流行 的 形式 之 一 。 黑 客 们 利用 
这 个 弱点 ,通过 操控 被 Web 应 用 接收 的 输入 来 获取 对 数据 库 的 控制 。 

2) C 和 CH+ 程序 中 的 缓冲 区 溢出 。 因 为 C 和 C++ 不 对 数组 访问 进行 边界 检查 , 黑客 就 可 以 写 出 一 
个 精心 构造 的 字符 串 ,使 得 它 从 缓冲 区 中 延伸 到 未 预料 到 的 区 域 , 从 而 控制 这 个 程序 的 运行 。 

在 下 一 节 中 ,我们 将 讨论 如 何 使 用 过 程 间 分 析 技 术 来 保护 程序 不 受 这 样 的 攻击 。 
12.2.5 SQL 注 入 


SQL 注入 是 一 种 黑客 攻击 方法 。 黑 客 可 以 通过 操纵 一 个 Web 应 用 的 用 户 输入 ,从 而 获得 对 
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数据 库 的 未 授权 访问 。 比 如 , 银行 可 能 希望 只 要 它 的 用 户 能 够 提供 正确 的 口令 ,他 就 可 以 在 线 完 
成 业务 处 理 。 这 类 系统 的 一 个 常用 体系 结构 是 让 用 户 在 一 个 Web 表单 中 输 太 字符 串 ， 然 后 把 这 
些 字符 串 组 成 某 个 用 SQL 语言 编写 的 数据 库 查 询 的 一 部 分 。 如 果 系 统 开发 者 不 小 心 , 用 户 提供 
的 字符 串 可 能 以 不 可 预料 的 方式 改变 这 个 SQL 语句 的 含义 。 
局 假设 一 个 银行 向 它 的 客户 提供 了 对 一 个 关系 

AcctData(name, password, balance) 
的 访问 。 也 就 是 说 , 这 个 关系 是 一 个 由 多 个 三 元 组 组 成 的 表 , 每 个 三 元 组 包含 二 个 客户 的 名 字 、 
账户 口令 和 该 账户 的 余额 。 系 统 的 本 意 是 使 得 客户 只 有 在 提供 了 他 们 的 名 字 和 正确 口令 之 后 才 
能 够 看 到 账户 余额 。 让 一 个 黑客 看 到 账户 余额 并 不 是 可 能 发 生 的 最 糟糕 的 事情 , 但 是 这 个 简单 
例子 是 更 复杂 情况 的 典型 代表 , 更 复杂 的 情况 是 黑客 可 以 使 用 那个 账户 付 账 。 

系统 可 以 按照 如 下 方式 实现 一 次 余额 查询 : 

1) 用 户 调用 一 个 Web 表单 ,在 表单 中 输入 他 们 的 名 字 和 口令 。 

2) 名 字 被 拷贝 到 一 个 变量 n, 口令 被 拷贝 到 另 一 个 变量 p。 

3) 然后 , 可 能 在 某 些 其 他 过 程 中 , 执行 下 列 SQL 查询 : 


SELECT balance FROM AcctData 
WHERE name = ’:n’ and password = ’:p’ 


我 们 向 不 熟悉 SQL 的 读者 解释 一 下 这 个 查询 含义 。 该 语句 的 含义 是 :“ 在 表 AcctData 中 找 
出 一 行 , 要 求 第 一 个 分 量 ( 名 字 ) 等 于 变量 n 中 的 当前 字符 串 , 而 第 二 个 分 量 (口令 ) 等 于 变量 p 
中 的 当前 字符 串 ; 然后 打印 这 一 行 的 第 三 个 分 量 (余额 )。” 请 注意 , 这 个 SQL 语句 使 用 了 单 引号 
而 不 是 双 引 号 来 分 割 符号 串 , n Ap 之 前 的 冒号 表明 它们 是 外 围 语言 的 变量 。 

假设 一 个 黑客 想 找到 Charles Dickens 的 账户 余额 , 他 向 n 和 pp 提供 了 下 面 的 值 : 


n = Charles Dickens’ -- p = who cares 


这 个 奇怪 的 字符 串 的 作用 是 把 上 面 的 查询 转变 成 
SELECT balance FROM AcctData 
WHERE name = ’Charles Dickens’ --’ and password = ’who cares’ 


在 很 多 数据 库 系统 中 , -- 是 一 个 注释 引导 符号 ,其 作用 是 把 该 行 中 跟 在 其 后 的 所 有 内 容 看 作 
一 个 注释 。 结 果 , 现在 这 个 查询 语句 要 求 数据 库 系统 打印 出 每 个 名 字 为 'Charles Dickens' 的 
个 人 的 账户 余额 , 而 不 考虑 在 name-password-balance 三 元 组 中 和 该 名 字 一 起 出 现 的 口令 。 也 就 是 
说 , 删除 注释 之 后 , 这 个 查询 变 成 了 : 国 | 


SELECT balance FROM AcctData 
WHERE name = ’Charles Dickens’ 


在 例子 12. 10 中 , 这 个 “ 坏 ”字符 串 被 保存 在 两 个 变量 中 , 它们 可 能 在 过 程 之 间 传 递 。 但 是 , 在 更 加 
真实 的 情况 中 , 这 些 字符 串 可 能 被 多 次 复制 , 或 者 和 其 他 字符 串 组 成 完整 的 查询 语句 。 如 果 我 们 不 对 
整个 程序 进行 全 面 的 过 程 间 分 析 , 就 不 能 指望 能 够 检测 到 导致 SQL 注入 攻击 的 代码 错误 。 

12.2.6 缓冲 区 溢出 

当 一 个 由 用 户 提供 的 精心 制作 的 数据 被 写 到 了 预想 的 缓冲 区 之 外 并 操纵 程序 的 执行 时 ， 就 
发 生 了 缓冲 区 溢出 攻击 (buffer overflow attack)。 比 如 , 一 个 C 程 序 可 能 从 用 户 那里 读 取 一 个 字符 
Bs, 然后 使 用 函数 调用 

strcpy(b,s); 

把 它 拷贝 到 一 个 缓冲 区 5 中。 如果 字 符 串 s 实际 上 比 缓冲 区 5 长 , 那么 在 缓冲 区 5 之 外 的 某 些 内 
存 位 置 上 的 值 将 会 被 改变 。 这 个 情况 本 身 可 能 会 使 程序 产生 故障 , 或 者 至 少 产生 错误 的 答案 , 因 
为 程序 使 用 的 某 些 数据 可 能 已 经 被 改变 了 。 
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但 是 实际 情况 会 更 糟糕, 选择 字符 串 * 的 黑客 可 以 选择 一 个 特别 的 值 ， 使 得 它 的 作用 不 仅仅 
是 引起 一 个 错误 。 比 如 ;如果 该 缓冲 区 位 于 一 个 运行 时 刻 栈 中 , IA eT RANE F 
地 址 的 位 置 很 近 。_… 个 经 过 精心 选择 的 恶意 的 * 值 可 以 材 盖 掉 这 个 地 址 ， 当 函数 返回 时 ， 它 跳 转 
到 黑客 选择 的 地 方 。 如 果 黑 客 熟 悉 操作 系统 和 硬件 ， 那么 他 们 就 能 够 执行 一 个 命令 ,让 系统 赋予 
他 们 控制 这 台 计 算 机 的 能 力 。 在 有 些 情 况 下 ， 他 们 甚至 可 以 有 能 力 证 那个 假 的 返回 地 址 把 控制 
传递 到 作为 字符 串 * 的 一 部 分 的 代码 中 , 这 样 就 能 将 任何 种 类 的 程序 插入 到 正在 执行 的 代码 中 。 

为 了 防止 缓冲 区 溢出 , 我 们 要 么 必须 通过 静态 的 方法 证 明 每 个 数组 写 运算 都 处 于 边界 之 内 ， 
要 么 必须 进行 适当 的 动态 数组 边界 检查 因为 在 'C 和 C++ 程序 中 必须 手工 插入 这 些 边界 检查 ， 
程序 员 很 容易 忘记 插入 测试 代码 ,或 者 插入 错误 的 测试 代码 。 人 们 已 经 开发 了 启发 式 工具 来 检 
杏 是 否 在 调用 一 个 strcpy 之 前 至 少 进行 了 某 些 测试 , 虽然 这 些 测试 不 一 定 是 正确 的 。 

动态 边界 检查 是 不 可 避免 的 ， 因 为 不 可 能 静态 地 确定 用 户 输入 的 大 小 。 静 态 分 析 可 以 做 的 
所 有 事情 就 是 保证 正确 地 插入 了 动态 检查 代码 。 因 此 一 个 可 行 的 策略 是 让 编译 器 在 每 个 与 操 
作 上 插入 动态 边界 检查 ,并 以 静态 分 析 为 手段 尽 可 能 优化 掉 动 态 检查 代码 。 这 样 就 不 再 需要 去 
捕捉 每 个 可 能 违背 边界 条 件 的 情况 。 而 且 ， 我 们 只 需要 优化 那些 频繁 执行 的 代码 区 域 。 

即使 我 们 不 在 乎 运行 开销 , 在 C 程序 中 插入 边界 检查 也 不 是 容易 的 事情 。 一 个 指针 可 能 指 
向 某 个 数组 的 中 间 , 而 且 我 们 还 不 知道 这 个 数组 的 大 小 。 可 以 使 用 已 有 的 技术 来 动态 跟踪 各 个 
指针 指向 的 缓冲 区 的 大 小 。 这 个 信息 允许 编译 器 为 所 有 的 访问 都 插入 数组 边界 测试 。 有 意思 的 
是 我 们 并 不 建议 一 检测 到 缓冲 区 溢出 就 停止 执行 程序 。 实 际 上 , 实践 中 确实 会 发 生 缓冲 区 滥 
出 .如果 我 们 不 允许 所 有 的 缓冲 区 溢出 ， 一 个 程序 就 很 容易 出 错 。 解 决 的 方法 是 动态 扩展 缓冲 区 
的 大 小 以 应 对 缓冲 区 游 出 。 

可 以 利用 过 程 间 分 析 技 术 来 提高 动态 的 数组 边界 检查 的 速度 。 比 如 , 假设 我 们 只 关注 和 用 
户 输入 字符 串 有 关 的 缓冲 区 溢出 , 那么 可 以 使 用 静态 分 析 技 术 来 决定 哪个 变量 可 能 存放 了 用 户 
提供 的 内 容 。 和 SQL 注入 一 样 ， 如 果 我 们 能 够 跟踪 一 个 输入 值 在 过 程 间 传递 复制 的 过 程 , 就 有 利 
于 消除 不 必要 的 边界 检查 。 


12.3 ”数据 流 的 一 种 逻辑 表示 方式 


可 以 说 , 到 现在 为 止 ， 我 们 对 数据 流 问 题 和 解答 的 表示 方法 是 基于 集合 理论 的 。 也 就 是 说 ， 
我 们 把 信息 表示 成 集合 , 并 通过 交 、 并 这 样 的 运算 来 计算 结果 。 比 如 ， 当 我 们 在 9.2.4 节 中 介绍 
到 达 定 值 问题 时 , 我 们 为 一 个 基本 块 计算 IN[B] 和 0UT[B], 并 把 它们 描述 为 定 值 的 集合 。 我 
们 用 基本 块 B 的 gen 和 集合 来 表示 这 个 基本 块 的 内 容 。 

为 了 应 对 过 程 间 分 析 的 复杂 性 ， 我 们 引入 一 个 更 加 通用 且 更 加 明确 的 基于 逻辑 的 表示 方法 。 
我 们 不 再 说 诸如 “ 定 值 D 在 IN[B] 中 ”这 样 的 断言 ， 而 是 使 用 类 似 于 in(B, D) 这 样 的 表示 方法 来 
天 示 同 样 的 意思 。 这 么 做 使 我 们 把 那些 用 以 推断 程序 性 质 的 简明 的 “规则 ”表示 出 来 。 它 也 使 我 
们 能 高 效 地 实现 这 些 规则 , 实现 方法 是 对 集合 运算 的 位 向 量 方法 进行 推广 。 最 后 , 逻辑 方法 使 我 
们 能 把 几 个 看 起 来 不 一 样 的 分 析 合 并 成 为 一 个 一 体 化 的 算法 。 比 如 , 在 9.5 节 中 , 我 们 用 四 个 数 
据 流 分 析 组 成 的 序列 及 两 个 中 间 步 又 描述 了 部 分 宛 余 消 除 方法 。 在 逻辑 表示 方法 中 , 这 些 步 又 
可 以 被 合并 成 为 一 组 逻辑 规则 。 我 们 可 以 同时 求解 这 些 规 则 。 

12.3.1 Datalog 简介 

Datalog 是 一 个 使 用 类 Prolog 表示 方法 的 语言 , 但 是 它 的 语义 要 比 Prolog 简单 得 多 。 首 先 ， 
Datalog HIG FEI WN p(X, Xz, … Xp) KURA (atom) ,其 中 : 

1) p 是 一 个 断言 一 一 个 表示 也 类 语句 的 符号 , 比如 和 二 个 定 值 到 达 了 二 个 基本 块 的 
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开始 处 "。 

2) Xi 、 Xpv ery X, 是 变量 或 常量 的 项 。 我 们 也 可 以 把 一 些 简单 表达 式 当 作 一 个 断言 的 
参数 ;9 

一 个 基础 原子 (ground atom) 是 一 个 其 参数 都 是 常量 的 断言 。 每 个 基础 原子 表明 了 一 个 特定 的 
事实 , 它 的 值 要 么 是 真 要 么 是 假 。 把 一 个 断言 表示 为 一 个 关系 (或 者 说 令 该 断言 取 真 值 的 基础 原子 
的 表 ) 通 常 比较 方便 。 每 个 基础 原子 表示 成 关系 的 一 行 , 或 者 说 一 个 元 组 。 这 个 关系 的 列 以 属性 命 
名 , 对 于 每 个 属性 , 每 个 元 组 都 有 一 个 对 应 的 分 量 。 这 些 属性 对 应 于 用 关系 方式 表示 的 基础 原子 的 
分 量 。 在 该 关系 中 的 所 有 基础 原子 的 值 都 是 真 , 不 在 此 关系 中 的 基础 原子 的 值 都 为 假 。 
我 们 假设 断言 (8B, D) 表示 “ 定 值 D 到 达 了 基本 块 B 的 开始 
处 ”, 并 假设 对 于 特定 的 流 图 计 (51， di) WAH in(b,, di) Ml in(by, d;) 也 为 
真 。 我 们 也 可 以 假设 对 于 这 个 流 图 而 言 , 所 有 其 他 关于 in 的 描述 都 是 假 的 。 
那么 图 12-12 中 的 关系 就 表示 了 对 应 于 这 个 流 图 的 此 断言 的 取 值 。 

这 个 关系 的 属性 为 8B 和 D。 这 个 关系 有 三 个 元 组 , 分 别 是 (5b1, di)、 图 12-12 使 用 一 
(by, di) 和 (Bb,, dy). El 

有 时 我 们 也 会 看 到 一 个 实际 上 是 变量 及 常量 之 间 的 比较 运算 的 原子 。 比 个 断言 的 什 
WX AY REX =10, ROTH, 断言 实际 上 是 比较 运算 符 。 也 就 是 说 , 我 们 可 以 把 不 =10 看 作 它 
的 断言 形式 : equals(X, 10)。 但 是 比较 断言 和 其 他 断言 有 一 个 最 大 的 不 同 之 处 。 一 个 比较 断言 有 它 的 
标准 解释 ,而 像 in 这 样 的 普通 断言 的 含义 是 由 一 个 Datalog 程序 (将 在 下 面 描述 ) 定 义 的 。 

字面 值 (literal) 是 一 个 原子 或 其 否定 形式 。 我 们 在 一 个 原子 前 加 NOT 来 表示 否定 。 因 此 ， 
NOT in(B, D) 是 一 个 断言 , RRE D 不 能 到 达 基 本 块 8 的 开始 处 。 
12. 3.2 Datalog 规则 

规则 是 表示 逻辑 推理 关系 的 一 种 方法 。 在 Datalog H, 规则 也 说 明了 如 何 完成 对 正确 的 事实 
的 计算 。 一 个 规则 的 形式 为 : 








H.:- B,&B,&---&B, 

其 中 的 组 成 部 分 如 下 : : 

© HAI Bi, Bz, 0n B AFM, 即 原 子 或 原子 的 否定 形式 。 但 五 不 能 是 否定 形式 。 

e H ÆRA k ,B, ` By, fe ON Ba 组 成 了 规则 的 体 。 

。 每 个 B; 有 时 被 称 为 规则 的 子 目 标 (subgoal) 。 

我 们 应 该 把 符号 : - 读 作 如果”。 一 个 规则 的 含义 是 “如 果 规 则 体 为 真 , 那么 规则 头 也 为 
真 " 。 更 精确 地 说 , 我 们 按照 下 面 的 方法 把 规则 应 用 到 一 组 给 定 的 基础 原子 集合 上 。 考 虑 所 有 可 
能 把 规则 中 的 变量 蔡 代 为 常量 的 替换 方法 。 如 果 某 个 替换 方法 使 得 规则 体 的 每 个 子 目标 都 为 真 
(假设 所 有 且 只 有 给 定 的 基础 原子 为 真 ), 那么 我 们 可 以 推断 : 按照 这 个 替换 方法 把 规则 头 中 的 
变量 替换 为 常量 之 后 得 到 的 断言 为 真 。 不 能 使 所 有 子 目 标 都 为 真 的 替换 方法 没有 给 我 们 任何 信 
息 , 替换 后 的 规则 头 可 能 为 真 也 可 能 为 假 。 

一 个 Datalog 程序 是 一 组 规则 的 集合 。 这 个 程序 被 应 用 于 一 组 “数据 ”， 即 某 些 断言 的 基础 原 
子 集合 。 这 个 程序 的 结果 也 是 一 组 基础 原子 的 集合 , 这 个 集合 通过 应 用 程序 中 的 规则 推断 得 到 。 
程序 将 不 断 应 用 其 中 的 规则 , 直到 不 能 推断 出 新 的 基础 原子 为 止 。 





O 严格 地 讲 , 这 样 的 项 是 从 函数 符号 构造 而 来 的 。 它 们 大 大 增加 了 Datalog 实现 的 复杂 性 。 但 是 , 只 有 在 不 把 事情 
复杂 化 的 情况 下 我 们 才 会 使 用 少量 运算 符 , 比如 常量 的 加 法 和 减法 。 
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一 个 Datalog 程序 的 简单 例子 是 给 定 一 个 图 的 (有 向 ) 边 , 计算 这 个 图 的 路 径 。 也 就 
是 说 , 断言 edee(X, 六 表示 “有 一 条 从 结 点 到 了 的 边 ”; 断言 path(X,Y) 表 示 从 XX 到 了 有 一 条 
路 径 。 定 义 路 径 的 规则 是 : 

1) path(X, Y) :- edge(X, Y) 

2) path(X, Y) :- path(X, Z) & path(Z, Y) 

第 一 个 规则 是 说 一 条 边 就 是 一 条 路 径 。 也 就 是 说 , 只 要 我 们 把 变量 下 替换 为 一 个 常量 且 
把 变量 了 蔡 换 为 一 个 常量 5， 并且 edge(a,， 5) 为 真 ( 即 有 一 条 从 结 点 a 到 结 点 b 的 边 ) , 那么 path 
(a, 5) 也 成 立 ( 即 有 一 条 从 a 到 4b 的 路 径 )。 第 二 个 规则 是 说 如 果 有 一 条 从 某 个 结 点 六 到 某 个 结 
点 Z 的 路 径 , 并 且 还 有 一 条 路 径 从 Z 到 结 点 Y, 那么 存在 一 条 从 下 到 了 的 路 径 。 这 个 规则 表示 
“传递 封闭 性 ”。 请 注意 , 任何 路 径 都 可 以 通过 选取 路 径 上 的 边 并 不 断 应 用 传递 封闭 性 规则 得 到 。 

比如 , 假设 下 列 事实 (基础 原子 ) 为 真 : edge(1, 2), edge(2, 3) 和 edge(3, 4) IWA, 我 们 可 
以 使 用 第 一 个 规则 进行 三 次 不 同 的 替换 , 推断 出 path(1, 2), path(2, 3) 和 path(3,4)。 例 如 , 按 
照 X=1 和 Y=2 进行 替换 可 以 得 到 第 一 个 规则 的 实例 path(1, 2) ;- edge(1, 2)。 因 为 edge(1， 
2) 为 真 , 所 以 可 以 推导 出 path(1, 2). 

根据 这 三 个 关于 path 的 事实 , 我 们 可 以 多 次 使 用 第 二 个 规则 。 如 果 按 照 X=1、Z =2 和 Y=3 进 
行 替换 , 我 们 可 以 得 到 这 个 规则 的 实例 path(1, 3) :- path(1, 2) &path(2, 3) 。 因 为 规则 体 中 的 两 
个 子 目 标 都 已 经 推导 出 来 , 已 知 它们 为 真 ; 所 以 可 以 推出 规则 头 : path(1, 3) 。 然 后 ,使 用 蔡 换 方法 
X=1, Y=2 和 2Z=4 推出 规则 头 path(1, 4) 。 也 就 是 说 , 从 结 点 1 到 结 点 4 有 一 条 路 径 。 o 





Datalog 的 编码 规则 ， 
我 们 将 在 Datalog 程序 中 使 用 如 下 编码 规则 : 
1) 变量 以 大 写字 符 开头 。 
2) 所 有 的 其 他 元 素 以 小 写字 符 或 其 他 符号 ( 比如 数字 ) 开头 。 这 些 元 素 包 括 断 言 和 用 作 
断言 参数 的 常量 。 


12.3.3 内涵 断 言 和 外 延 断 言 

按照 Datalog 程序 的 惯例 , 我 们 把 断言 分 成 两 类 : 

1) EDB 断言 , 或 者 说 外 延 数据 库 (extensional database) BS, 是 事先 定义 的 断言 。 也 就 是 说 , 它们 
的 真 值 事 实 要 么 通过 一 个 关系 或 表 给 出 , 要 人 么 根据 断言 的 含义 给 出 ( 比如 一 个 比较 断言 的 情况 ) 。 

2) IDB 断言 , 或 者 说 内 涵 数 据 库 (intensional database) Bra , 只 能 通过 规则 定义 。 

一 个 断言 要 么 是 IDB, 242 EDB, 且 只 能 是 其 中 之 一 。 这 个 规定 的 结果 是 , 任何 出 现在 一 
个 或 多 个 规则 头 中 的 断言 必然 是 一 个 IDB 断言 。 出 现在 规则 体 中 的 断言 可 以 是 IDB, 也 可 以 是 
EDB, Ikin, 在 例子 12. 12 H, edge 是 一 个 EDB 断言 , path 是 一 个 IDB 断言 。 回 忆 一 下 ， 我 们 给 
出 了 一 些 关于 edge 的 事实 ,比如 edge(1, 2), 但 是 所 有 的 path 事实 都 是 通过 规则 推导 出 来 的 。 

当 Datalog 程序 用 于 表示 数据 流 算法 时 , 其 中 的 EDB 断言 是 根据 流 图 本 身 计算 得 到 的 。IDB 
断言 被 表示 成 规则 , 而 数据 流 问题 的 解决 方法 就 是 根据 这 些 规 则 和 给 定 的 EDB 事实 中 推导 出 所 
有 可 能 的 IDB 事实 。 

让 我 们 考虑 可 以 如 何在 Datalog 中 表示 到 达 定 值 问题 。 首 先 , 在 语句 层次 上 (而 不 是 
在 基本 块 层次 上 ) 考 虑 问题 是 有 道理 的 。 也 就 是 说 , 从 一 个 基本 块 构 造 它 的 gen 和 kill 集合 的 计 
算 过 程 将 会 和 到 达 定 值 本 身 的 计算 集成 在 一 起 。 因 此 , 图 12-13 中 给 出 的 基本 块 b| 是 很 典型 的 。 
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请 注意 ; 如 果 一 个 基本 块 内 有 n 个 语句 ,那么 我 们 用 编号 1, 2，…, n 来 标记 块 内 的 程序 点 。 第 i 
个 定 值 在 第 i 点 上 出 现 , 而 在 0 点 上 没有 定 值 出 现 。 

程序 中 的 一 个 点 可 以 表示 为 一 个 二 元 组 (5, n), 其 中 5 是 一 个 基本 块 , 而 
n 是 0 到 基本 块 5 内 的 语句 数量 之 间 的 一 个 整数 。 我 们 的 表示 方法 需要 两 个 
EDB 断言 ; 

1) def(B, N, X) 为 真 当 且 仅 当 基本 块 卫 中 的 第 N 个 语句 可 以 对 变量 工 定 
值 。 比 如 , 在 图 12-13 +H, def(b,, 1, x) WIE, def(b,, 3, x) NAH def(b1, 2， 图 12-13 一 个 语 
Y) 对 所 有 可 能 在 这 个 点 上 被 指针 p 指向 的 变量 了 都 为 真 。 现 在 我 们 将 假设 了 句 中 包含 指针 
可 以 是 任何 具有 p 所 指 类 型 的 变量 。 的 基本 块 

2) suce(B, N, 0) 为 真 当 且 仅 当 在 流 图 中 基本 块 C 是 基本 块 B 的 后 继 , 且 B 具 及 个 语句 。 
也 就 是 说 ,控制 流 可 以 从 下 的 点 N 到 达 C 的 点 0。 比 如 , 假设 bo 是 图 12-13 中 基本 块 5 的 前 驱 ， 
Hb, 具有 5 个 语句 ,那么 suce(by, 5, b1) WH. 

这 个 Datalog 程序 有 一 个 IDB WE rd(B, N, C, M, XX) 。 这 个 断言 为 真 当 是 仅 当 在 基本 块 C 上 的 第 
M 个 语句 中 对 变量 XX 的 定 值 到 达 了 基本 块 8 的 点 V。 定义 断言 rd 的 规则 在 图 12-14 中 显示 。 

规则 1 说 明 , 如 果 基本 块 8 的 第 NN 个 语句 对 X 定 值 , 那么 X 的 这 个 定 值 到 达 8 的 第 NN 个 点 
( 即 紧 跟 在 这 个 语句 之 后 的 点 ) 。 我 们 前 面 给 出 了 到 达 定 值 问题 的 集合 理论 表示 方法 ， 而 这 个 规 
则 对 应 于 该 表示 方法 中 的 概念 gen。 

规则 2 表示 除非 一 个 定 值 被 某 个 语句 杀 死 , 否则 它 可 以 穿越 这 个 语句 。 而 杀 死 一 个 定 值 的 叭 
一 方法 是 100% 肯定 地 对 其 中 的 变量 重新 定 值 。 详 细 地 说 , 规则 2 说 明 来 自 基本 块 C 中 的 第 履 个 
语句 的 对 变量 的 定 值 到 达 基本 块 中 的 点 的 条 件 是 

1) 它 到 达 了 前 一 个 结 点 , 即 B 中 的 点 N-1。 

2) 同时 至 少 有 一 个 不 同 于 X 的 变量 Y 可 能 在 B 的 第 N 个 语句 中 定 值 。 

最 后 , 规则 3 表示 了 流 图 的 控制 流 。 它 说 基本 块 C 中 第 MM 个 语句 中 对 X 的 定 值 到 达 基 本 块 
8 的 第 0 点 的 条 件 是 存在 某 个 具有 N 个 语句 的 基本 块 D, 使 得 这 个 对 的 定 值 到 达 D 的 结尾 处 ， 
F-E. B Æ D 的 一 个 后 继 。 O 

例 12. 13 中 的 EDB 断言 suce 显然 可 以 从 流 图 中 获得 。 如 果 我 们 保守 地 估计 一 个 指针 可 能 指 
向 任何 地 方 , 那么 可 以 从 流 图 中 得 到 def 断言 。 如 果 我 们 希望 把 一 个 指针 所 指向 的 范围 限定 在 具 
有 适当 类 型 的 变量 中 , 那么 我 们 可 以 从 符号 表 中 获取 类 型 信息 , 从 而 使 用 一 个 较 小 的 关系 def. 
另 一 种 可 选 的 方法 是 把 def 变 成 一 个 IDB 断言 ,并 通过 规则 来 定义 它 。 这 些 规则 将 使 用 更 基本 
EDB 断言 , 而 这 些 断 言 本 身 可 以 从 流 图 和 符号 表 中 获得 。 

i) 12. 14 假设 我 们 引入 两 个 新 的 EDB 














eF 1) rd(B,N,B,N,X) :-  def(B,N,X) 

1) assign (BUN, X) HM ARBAB pE ANEA, r paN e 
的 第 入 个 语句 的 左 部 为 X。 请 注意 , 了 可 以 是 KEX 
一 个 变量 ， 也 可 以 是 一 个 具有 左 值 的 简单 表达 3) rd(B, 0,C, M, X) ‘= rd(D, N, on M, X) & 
st, Han * Do suce(D, N, B) 

2) WR X WA A T, ABA type(X, T) 为 本 
真 。 同 样 , X 可 以 是 具有 左 值 的 任意 表达 式 ， 图 12-14 断言 rd 的 规则 集合 


而 7 可 以 是 任何 合法 的 类 型 表达 式 。 
然后 , 我 们 就 可 以 写 出 def 的 规则 , 使 得 def 成 为 一 个 IDB 断言 。 图 12-15 是 对 图 12-14 的 一 


过 程 间 分 析 aa 





个 扩展 , 它 增 加 了 两 个 def 的 可 能 规则 。 规 则 4 说明, 如 果 基 本 块 B 的 第 入 个 语句 对 XX 赋 值 , 那 

么 这 个 语句 就 对 XX 定 值 。 规 则 5 说 明 , 如 果 基 本 块 B 的 第 个 语句 对 *P 赋 值 , 且 X 是 具有 PP 所 

指 类 型 的 任何 变量 , 那么 这 个 语句 也 可 能 对 X 定 值 。 其 他 类 型 的 赋值 语句 需要 其 他 的 def 规则 。 
现在 举例 说 明 如 何 使 用 图 12-15 中 的 规则 


进行 推导 。 让 我 们 重新 考虑 图 12-13 中 的 基本 ee ee a 
Hb 第 一 个 语句 把 一 个 值 赋 给 变量 x, 因此 事 rd(B,N,C,M,X) : Ey & 
SE assign (bı, 1, x) HIA EDB 中 。 第 三 个 语句 X#Y 
也 对 * 赋值 ， 因 此 assign (bi, 3, x) 也 是 一 个 rd(B,0,C,M,X) = FAD; NCM X) & 
EDB 事实 。 第 二 个 语句 通过 p 间接 赋值 ,， 因此 succ(D, N, B) 
第 三 个 EDB SESE AE assign (b1, 2, *p)o 规则 4 def(B,N,X) ::  assign(B, N, X) 
允许 我 们 推导 出 def(b,, 1, x) def(b,, 3, %) 0 

假设 的 类 型 是 指向 整数 的 指针 ( * int), mea Ms? fs) sure 





Ax 和 yy 都 是 整数 。 那 么 我 们 可 以 使 用 规则 5， type(P, *T) 
A Red, Nal, P= pel eint pA Sw 
y, HERB def(b,, 2, x) 和 def( bi, 2, 7). X 
似 地 , 我 们 可 以 对 其 他 类 型 为 整数 或 可 转变 为 整数 的 变量 推导 出 同样 的 结果 。 闻 
12.3.4 Datalog 程序 的 执行 

每 一 组 Datalog 规则 都 定义 了 它 的 IDB 断言 的 关系 。 这 些 关 系 是 程序 中 的 EDB 断言 关系 表 的 
函数 。 开 始 时 假设 IDB 关系 为 空 ( 即 对 于 所 有 可 能 的 参数 , 各 个 IDB 断言 为 假 ) 。 然 后 重复 应 用 
这 些 规则 , 根据 这 些 规则 不 断 推导 出 新 的 事实 。 当 推导 过 程 收敛 时 , 就 完成 了 程序 的 运行 。 运 行 
得 到 的 IDB 关系 就 形成 了 程序 的 输出 。 这 个 过 程 将 在 下 面 的 算法 中 正式 给 出 。 这 个 算法 和 第 9 
章 中 讨论 的 迭代 算法 类 似 。 
| 


求 值 。 Rp e 0; 
输入 :一 个 Datalogi 程序 和 各 个 | | While (Boe TEER A, HIE ) { 


图 12-15 ”断言 rd 和 def 的 规则 








eae 考虑 所 有 可 能 的 对 各 个 规则 中 的 变量 进行 常量 
EDB 断言 的 事实 集合 。 sk i 
输出 : 每 个 IDB 断言 的 事实 集合 。 对 于 每 个 替换 方法 ， 使 用 当前 的 ,来 确定 BEDB 和 IDB 断 言 
方法 : 对 于 程序 中 的 每 个 断言 p; | 3 en o p 
te go Ss H if ( 基 个 替换 方法 使 得 一 个 规则 的 规则 体 为 真 ) 
S R, 为 使 该 断言 为 真 的 事实 关系 。 如 设 规则 的 头 断 言 为 "将 替换 后 的 头 加 入 到 现 中 。 
果 p 是 一 个 EDB 断言 , 那么 R, 就 是 该 
Ss bh Si ER 
断言 给 出 的 所 有 事实 。 UE pF Í 图 12.16 Datalog FEF RIN 
IDB 断言 , 我 们 将 计算 R, 。 执 行 图 12-16 
中 的 算法 。 iat 


例 12.12 中 的 程序 计算 一 个 图 中 的 路 径 。 应 用 算法 12.15 时 ,最初 EDB 断言 edge 保 
存 了 该 图 的 所 有 边 ， 而 path 的 关系 为 空 。 第 一 轮 的 时 候 , 规则 2 没有 产生 任何 结果 , 因为 此 时 还 
没有 path 的 事实 。 但 是 规则 1 使 得 所 有 的 edge 事实 都 变 成 了 path 事实 。 也 就 是 说 , 在 第 一 轮 过 
后 , 我 们 知道 path(a, 5) 成 立 当 且 仅 当 有 一 条 从 a 到 5 的 边 。 

在 第 二 轮 中 , 规则 1 没有 生成 新 的 path 事实 , 因为 EDB 关系 edge 没有 改变 。 但 是 ,现在 规 
则 2 令 我 们 把 两 个 长 度 为 1 的 路 径 连 接 到 一 起 生成 一 个 长 度 为 2 的 路 径 。 也 就 是 说 , 在 第 二 轮 之 
Ja, path(a,5) 为 真 当 且 仅 当 从 a 到 45 有 一 条 长 度 为 1 或 2 的 路 径 。 类 似 地 , 在 第 三 轮 中 , 我 们 可 
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以 把 长 度 不 大 于 2 的 路 径 连 接 起 来 找到 所 有 长 度 不 大 于 4 的 路 径 。 在 第 四 轮 ， 我 们 发 现 最 大 长 度 
为 8 的 路 径 , 并 且 一 般 来 说 , 在 第 i 轮 之 后 , path(&, 5) 为 真 当 且 仅 当 有 一 个 从 a 到 5 上 且 长 度 不 大 
于 2i71 的 路 径 。 El 
12.3.5 Datalog 程序 的 增 量 计算 

有 一 个 可 行 的 方法 可 以 提高 算法 12. 15 的 效率 。 请 注意 , 一 个 新 的 IDB 事实 只 能 在 第 i 轮 被 发 
现 的 条 件 如 下 : 它 是 对 某 一 个 规则 进行 常量 蔡 换 后 的 结果 , 并 且 其 中 至 少 有 一 个 子 目标 经 过 变换 变 
成 刚刚 在 第 ; -1 轮 发 现 的 新 事实 。 这 个 论断 的 证 明 如 下 : 如 果子 目标 中 的 所 有 事实 在 第 i-2 轮 的 
时 候 都 是 已 知 的 , 那么 这 个 “新 ”的 事实 应 该 在 第 i-1 轮 进行 同样 的 常量 蔡 换 时 就 已 经 被 发 现 了 。 

为 了 利用 这 个 性 质 , 我 们 为 每 个 IDB 断言 p 引入 一 个 断言 newP, 该 断言 只 对 上 一 轮 中 新 发 现 
的 事实 成 立 。 每 一 个 在 其 子 目 标 中 包含 了 一 个 或 多 个 IDB 的 规则 都 被 蔡 换 为 一 组 规则 。 这 组 
规则 中 的 每 一 个 都 是 通过 把 原来 规则 体 中 的 某 一 个 IDB 断言 9 替换 为 newQ 而 得 到 的 。 最 后 , 对 
于 所 有 的 规则 , 我 们 把 规则 头 的 断言 h ERA newH。 得 到 的 这 些 规 则 被 称 为 具有 增 量 式 形式 
(incremental form) 。 

像 算 法 12. 15 那样 , 对 应 于 每 个 IDB 断言 p 的 关系 累积 了 所 有 的 bp 的 事实 。 FEB, RiT 

1) 应 用 新 的 规则 对 newP 断言 求 值 。 

2) 然后 从 newP PRE p, 保证 newP 中 的 事实 确实 是 新 的 。 

3) 把 这 些 newP 的 事实 加 入 到 p 中 。 


4) 把 所 有 newX 关系 表 设 置 为 空 ,准备 进行 下 一 1) newPath(X,Y) :- edge(X,Y) 
轮 计算 。 2a) newPath(X,Y) :- path(X,2)& 
这 个 想法 将 在 算法 12. 18 中 正式 描述 。 在 此 之 newPath(Z,Y) 


前 ,我 们 将 先 给 出 一 个 例子 。 2b) newPath(X,Y) :- newPath(X,Z) & 


再 次 考虑 例子 12.12 中 的 Datalog 程序 。 iS 

该 程序 的 规则 的 增 量 形式 在 图 12-17 中 给 出 。 规 则 1 的 ”图 12-17 Datalog 程序 path 的 增 量 式 规则 
规则 体 中 没有 IDB 子 目标 , 因此 除了 规则 头 之 外 没有 任何 改变 。 但 是 规则 2 中 有 两 个 IDB 子 目标 ， 
因此 它 变 成 了 两 个 不 同 的 规则 。 在 每 个 规则 中 ,path 在 规则 体 中 的 某 次 出 现 被 替换 为 newPath。 这 
两 个 规则 合 起 来 保证 了 上 面 描 述 的 思想 得 以 实 
施 ; 即 根据 规则 连接 起 来 的 两 条 路 径 中 至 少 有 





一 条 是 在 上 一 轮 中 发 现 的 。 Oo 

Datalog 程序 的 增 量 求 值 。 
输入 :一 个 Datalog 程序 和 各 个 EDB 断言 考虑 对 所 有 规则 中 的 变量 的 所 有 常量 替换 方案 ; 

的 事实 集合 。 对 每 个 替换 方案 ， 利 用 Ry 和 Rwewp 来 决定 各 个 

APE EDB 和 IDB 断言 的 真 假 ， 从 而 确定 是 否 有 某 个 

输出 : 各 个 IDB 断言 的 事实 集合 。 规则 体 的 所 有 子 目标 都 为 真 i 
方法 : 对 于 程序 中 的 每 个 断言 p, OR, 表 if ( 某 个 替换 方案 使 得 一 个 规则 的 规则 体 为 真 ) 

示 使 此 断言 为 磋 的 事实 的 关系 。 如 果 p 是 一 AEEA TEANS a PES 

on 5 ae hh 是 该 规则 的 头 的 断言 ; 

N EDB 断言 , 那么 R, 就 是 该 断言 对 应 的 事实 for (每 个 断言 p) { 

集合 。 如 果 p 是 一 个 IDB 断言 , 我 们 将 计算 得 pats td 

到 R,。 另 外 ,对 于 每 个 IDB 断言 p, 令 Rp } TAERE? 

为 对 应 于 断言 p 的 “新 "事实 的 关系 。 } until (所 有 Raewp BAZ ); 





1) 把 程序 的 规则 修改 为 上 面 描述 的 增 量 
ER- 图 12-18 Datalog 程序 的 求 值 
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2) 执行 图 12-18 中 的 算法 。 口 





集合 表示 法 的 增 量 求 值 
以 增 量 的 方式 来 解决 基于 集合 理论 的 数据 流 问 题 也 是 可 行 的 。 比 如 , 在 到 达 定 值 问题 
中 , 只 有 当 一 个 定 值 刚 被 发 现在 基本 块 B 的 前 驱 p 的 0UTLP] 中 时 , 这 个 定 值 才能 够 在 本 次 
计算 中 出 现在 IN[B1 中 。 我 们 之 所 以 没有 尝试 以 增 量 的 方式 来 解决 这 样 的 数据 流 问 题 , 因为 
位 向 量 的 实现 方式 已 经 非常 高 效 了 。 一般 来 说 , 直接 计算 整个 向 量 要 比 决定 一 个 事实 是 否 为 
新 事实 更 加 容易 。 














12. 3.6 有 问题 的 Datalog 规则 

有 些 Datalog 规则 , 或 者 说 程序 , 在 技术 上 没有 任何 意义 , 因此 不 应 该 使 用 。 两 种 最 严重 的 风 
险 是 : 

1) 不 安全 规则 : 这 些 规则 的 头 中 有 一 个 变量 没有 以 适当 的 方法 出 现在 规则 体 中 。 正 确 的 方 
法 必须 限定 这 个 变量 只 能 取 那 些 出 现在 EDB 中 的 值 。 

2) 不 可 分 层 的 程序 ; 一 组 规则 之 间 存 在 涉及 否定 形式 的 循环 定义 。 

我 们 将 详细 讨论 这 两 个 风险 。 

安全 规则 

出 现在 某 个 规则 头 的 任何 变量 都 必须 出 现在 规则 体 中 。 不 仅 如 此 , 这 个 变量 所 在 的 子 目 标 
必须 是 一 个 普通 IDB 或 EDB 原子 。 我 们 不 能 接受 一 个 变量 只 出 现在 一 个 否定 原子 中 或 比较 运算 
符 中 的 情况 。 制 定 这 个 策略 是 为 了 避免 那些 可 能 使 我 们 推导 出 无 穷 多 个 事实 的 规则 。 


规则 
p(X, Y) :- q(Z) & NOT r(X) & XAY 


是 不 安全 的 。 原 因 有 两 个 : 变量 下 只 出 现在 否定 的 子 目 标 r O) MERRER XAY H; 了 只 出 现 
在 比较 式 中 。 结 果 是 只 要 7(X) 为 假 且 7 不 同 于 处 , p 对 于 无 穷 多 个 二 元 组 (X, Y) 为 真 。 o 

可 分 层 的 Datalog 程序 

为 了 让 一 个 程序 有 意义 ,递归 定义 和 否定 形式 必须 分 开 。 正 式 要 求 如 下 。 我 们 必须 能 够 把 
IDB 断言 分 割 成 为 多 个 层次 (strata) , 使 得 如 果 存在 一 个 规则 ,其 头 断 言 为 p 且 有 一 个 形 如 Nor 
4(…) 的 子 目标 ,那么 4 要 么 是 一 个 EDB, 要 么 是 一 个 层次 低 于 的 IDB 断言 。 只 要 满足 这 个 规 
则 , 我 们 就 可 以 用 算法 12. 15 或 算法 12. 18 从 低 到 高 地 对 各 个 层次 求 值 。 首 先 处 理 处 理 较 低层 次 
的 IDB, 在 处 理 较 高 层次 时 把 低层 次 上 的 IDB 当 作 EDB, 但 是 , 如 果 我 们 违反 了 这 个 规则 ,那么 
如 下 面 的 例子 所 示 , 选 代 算 法 可 能 无 法 收敛 。 
考虑 下 面 的 由 单个 规则 构成 的 Datalog 程序 : 

; p(X) :- e(X) & NOT p(X) 
假设 。 是 一 个 EDB 断言 , 并 且 只 有 e(1 ) 为 真 。 那 么 p(1 ) 为 真 吗 ? 

这 个 程序 是 不 可 分 层 的 。 不 管 我 们 把 p 放 在 哪 一 层 , 它 的 规则 中 有 一 个 子 目 标 是 某 个 IDB 
( 即 p 本 身 ) 的 否定 形式 , 且 这 个 IDB( 即 p) 所 在 的 层次 当然 不 会 比 p 的 层次 更 低 。 

如 果 我 们 应 用 上 面 的 迭代 算法 , 我 们 从 R =0 开始 , 因此 开始 时 的 答案 是 “不 ; p(1) 不 为 
真 。 但 是 , 因为 e(1) 和 NoT p(1) 都 为 真 , 所 以 第 一 次 达 代 时 推导 出 p(1)。 但 是 , 之 后 的 第 二 次 
迭代 告诉 我 们 p(1) 为 假 。 也 就 是 说 , 在 这 个 规则 中 ,把 X 车 换 为 1 不 会 令 我 们 推导 出 p(1), 因 
为 子 目标 NOT p(1) 为 假 。 类 似 地 , 第 三 次 迭代 说 p(1) 为 真 , 第 四 次 送 代 说 它 是 假 , 如 此 往复 。 
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我 们 断定 这 个 不 可 分 层 的 程序 是 无 意义 的 , 也 不 能 把 它 看 作 一 个 正确 的 程序 。 O 
12.3.7 12.3 节 的 练习 

| 练习 12. 3. 1: 在 这 个 问题 中 , 我 们 将 考虑 一 个 比例 子 12. 13 简单 的 到 达 定 值 数 据 流 分 析 
问题 。 假 设 每 个 语句 本 身 就 是 一 个 基本 块 , 并且 一 开始 的 时 候 假 设 每 个 语句 对 且 只 对 一 个 变量 
E. EDB 断言 pred(1, J) 表示 语句 了 是 语句 了 的 一 个 前 驱 。EDB 断言 defines(1, X) 表示 语句 7 
所 定 值 的 变量 为 X。 我 们 将 使 用 IDB 断言 in(1, D) 和 outl, D) 分 别 表示 定 值 D 到 达 语 句 了 的 开 
头 和 结尾 。 请 注意 , 一 个 定 值 实际 上 是 一 个 语句 的 编号 。 图 12-19 是 一 个 Datalog 程序 , 它 表 示 计 
算 到 达 定 值 的 常用 算法 。 | 

请 注意 , 规则 1 是 说 明 一 个 语句 杀 死 了 它 自 己 , 但 是 规则 2 保证 一 个 语句 总 是 在 它 自己 的 输出 集 
合 中 。 规 则 3 是 普通 的 传递 函数 。 因 为 1 可 以 有 多 个 前 驱 , 所 以 规则 4 表示 了 交汇 运算 的 情况 。 

你 要 解决 的 问题 是 修改 这 些 规 则 来 处 理 常见 的 二 义 性 定义 的 情况 ,比如 通过 一 个 指针 进行 
赋值 运算 。 在 这 种 情况 下 ，defires(7, X) 对 多 个 不 同 的 下 和 一 个 7 成立。 一 个 定 值 最 好 表示 为 一 
个 二 元 组 (D, X), 其 中 是 一 个 语句 ,说 是 一 个 可 能 被 D 定 值 的 变量 。 这 样 做 的 结果 是 , in 和 
out 变 成 了 带 有 三 个 参数 的 断言 。 例 如 , nC, D, X) 表 示 在 语句 D 上 对 的 (可 能 的 ) 定 值 到 达 了 
语句 1 的 开始 处 。 

练习 12. 3.2 : 编写 一 个 和 图 12-19 类 似 的 





Datalog 程序 来 计算 可 用 表达 式 。 除 了 断言 defines RUI D) : defines(I, X) & defines(D, X) 
之 外 ,再 加 上 一 个 断言 euaj(7, X, 0, Y) 。 这 个 断 oUt LED defines(I, X) 
言说 明 语句 7 使 得 表达 式 XY0Y 被 求 值 。 这 里 0 out(I,D) :-  in(I,D) & NOT kill(I, D) 


是 表达 式 中 的 运算 符 , 例如 + 。 ind, D) :-  out(J,D) & pred(J,1) 

练习 12.3.3: 编写 一 个 和 图 12-19 类 似 的 Data- 
leg 程序 来 计算 活 哆 变量。 除了 世 言 ddfines 之 外 ; 假 INS TIME 
$ ee T atalog 程序 
设 一 个 断言 we(7， 妈 表示 语句 了 使 用 了 变量 X。 

练习 12. 3. 4: 在 9.5 节 中 , 我 们 定义 了 一 个 涉及 六 个 概念 的 数据 流 计算 , 这 些 概 念 包括 : 预 
期 执行 的 、 可 用 的 、 最 早 的 (earlist)、 可 后 延 的 、 最 后 的 (latest) 和 被 使 用 的 。 假 设 我 们 已 经 编写 
了 一 个 Datalog 程序 。 程序 中 包含 了 一 些 以 EDB 断言 方式 定义 的 可 以 从 程序 中 获得 的 概念 (例如 
gen FI kil (FE), 并 且 使 用 这 些 EDB 断言 和 这 六 个 概念 中 的 其 他 概念 定义 了 每 个 概念 。 这 六 个 
概念 中 的 哪些 概念 依赖 于 哪些 其 他 概念 ?这 些 依 赖 关 系 中 哪些 是 否定 形式 的 ? 得 到 的 Datalog 程 
序 是 可 分 层 的 吗 ? 

练习 12.3.5: 假设 EDB 断言 edge(X; 切 包 含 下 面 的 事实 : 

edge(1,2) edge(2,3) edge(3, 4) 

edge(4, 1) edge(4,5) edge(5, 6) 

1) 使 用 算法 12. 15 中 的 简单 求 值 策略 , 在 这 个 数据 上 模拟 运行 例子 12. 12 中 的 Datalog 程序 。 
给 出 每 一 轮 中 找到 的 path 事实 。 

2) 在 这 个 数据 上 模拟 执行 图 12-17 中 的 Datalog 程序 。 该 程序 实现 了 算法 12. 18 中 的 增 量 式 
求 值 策略 。 给 出 每 一 轮 中 找 出 的 path 的 事实 。 

练习 12. 3. 6: 下 面 的 规则 

P(X, Y) w q(X,Z) & r(Z, W) & NOT p(W, Y) 


是 一 个 较 大 的 Datalog 程序 了 的 一 部 分 。 
1) 指出 这 个 规则 的 头 、 规 则 体 和 各 个 子 目标 。 
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2) 哪些 断言 一 定 是 程序 P 的 IDB 断言 ? 

3) 哪些 断言 一 定 是 P 的 EDB 断言 ? 

4) 这 个 规则 安全 吗 ? 

5) 是 可 分 层 的 吗 ? 

练习 12. 3.7: 把 图 12-14 中 的 规则 转换 成 为 增 量 形式 。 


12.4 一 个 简单 的 指针 分 析 算 法 


在 本 节 中 , 我 们 开始 讨论 一 个 非常 简单 的 控制 流 无 关 的 指针 别名 分 析 技 术 。 这 个 技术 假设 
被 分 析 程 序 中 没有 过 程 调用 。 我 们 将 在 以 后 各 节 中 说 明 如 何 处 理 过 程 , 首先 给 出 上 下 文 无 关 的 
处 理 方法 ,然后 再 给 出 上 下 文 相关 的 方法 。 控 制 流 相关 会 增加 很 多 复杂 性 , 并 且 对 于 Java 这 样 的 
语言 来 说 , 因为 方法 常常 很 小 , 所 以 控制 流 相 关 性 和 上 下 文 相关 性 相 比 就 不 是 那么 重要 。 

在 指针 别名 分 析 中 , 我 们 希望 了 解 的 基本 问题 是 一 对 给 定 的 指针 是 否 可 能 互 为 别名 。 回 答 
这 个 提 间 的 方法 之 一 是 对 每 个 指针 计算 下 面 问题 的 答案 :“ 这 个 指针 可 能 指向 哪些 对 象 2” 如 果 两 
个 指针 可 能 指向 同一 个 对 象 , 那么 它们 可 能 互 为 别名 。 
12.4.1 为 什么 指针 分 析 有 难度 

对 C 语言 程序 进行 指针 别名 分 析 特 别 困 难 ， 因为 C 程序 可 以 对 指针 进行 任何 运算 。 实 际 上 ， 
程序 可 以 读 入 一 个 整数 并 把 它 赋 给 一 个 指针 , 这么 做 会 使 得 这 个 指针 成 为 程序 中 所 有 其 他 指针 
变量 的 别名 。Java 中 的 指针 称 为 引用 , 对 它们 的 分 析 要 简单 得 多 。 它 不 支持 算术 运算 , 并 且 指针 
只 能 指向 一 个 对 象 的 开头 。 

指针 别名 分 析 必 须 是 过 程 间 分 析 。 没 有 过 程 间 分 析 , 我 们 就 必须 假设 任何 方法 调用 都 可 能 
改变 所 有 可 被 它 访问 的 指针 变量 所 指向 的 内 容 , 造成 所 有 过 程 内 的 指针 别名 分 析 非 常 低 效 ， 

支持 间接 函数 调用 的 语言 对 指针 别名 分 析 提 出 了 另 一 个 挑战 。 在 C 语言 中 , 火 们 可 以 通过 
调用 一 个 解 引用 的 函数 指针 来 实现 函数 的 间接 调用 。 在 分 析 被 调用 函数 之 前 ,我 们 需要 知道 这 
个 函数 指针 指向 哪里 。 显 然 , 在 分 析 被 调用 的 函数 之 后 , 我 们 会 发 现 这 个 函数 指针 可 能 指向 更 多 
的 函数 ,因此 这 个 过 程 需要 迭代 进行 

虽然 C 语言 中 的 大 部 分 函数 是 被 直接 调用 的 , 但 是 Java 中 的 虚 方法 使 得 很 多 调用 成 为 间接 
调用 。 给 定 一 个 Java 程序 中 的 调用 x m( ) ,对象 可 能 属于 很 多 个 类 , 这 些 类 都 具有 名 为 m 的 
方法 。 我 们 对 * 的 实际 类 型 了 解 得 越 精确 , 我 们 的 调用 图 也 就 越 精确 。 在 理想 情况 下 , 我们 可 以 
在 编译 时 刻 准确 地 确定 * 的 类 ， 从 而 准确 知道 指向 哪个 方法 。 


考虑 下 面 的 Java 语句 序列 


Object o; 
o = new String(); 
n = o.hashCode(); 


这 里 。 被 声明 为 一 个 object。 如 果 不 分 析 。 指 向 什么 , 我 们 必须 把 在 各 个 类 中 声明 的 名 为 
“hashCode” 的 所 有 方法 都 当 作 可 能 的 调用 目标 。 知 道 。 指向 一 个 string 对 象 将 会 使 过 程 间 分 
析 把 范围 精确 地 缩小 到 在 String 中 声明 的 方法 。 L) 

也 可 以 使 用 近似 的 方法 来 减少 目标 的 数量 。 比 如 , 我 们 可 以 静态 地 确定 被 创建 的 对 象 的 类 
型 , 然后 把 分 析 范 围 限定 在 这 些 类 型 中 。 但 是 , 如 果 我 们 可 以 在 做 指针 指向 分 析 的 同时 , 利用 指 
针 指 向 信息 动态 地 构造 调用 图 ， 就 可 以 得 到 更 加 精确 的 结果 。 更 加 精确 的 调用 图 不 仅仅 可 以 获 
得 更 加 精确 的 结果 , 也 可 以 大 大 减少 分 析 所 需 时 间 。 

指针 指向 分 析 是 很 复杂 的 。 它 不 是 “简单 的 "数据 流 问题 , 在 这 类 问题 中 我 们 只 需要 模拟 音 
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次 执行 一 个 语句 循环 的 效果 。 在 指针 分 析 中 ， 当 我 们 发 现 一 个 新 的 指针 目标 时 , 我 们 必须 重新 分 
析 所 有 把 这 个 指针 所 指向 的 内 容 赋 给 其 他 指针 的 语句 。 

为 简单 起 见 , 我 们 将 主要 关注 Java。 我 们 将 从 控制 流 无 关 和 上 下 文 无 关 的 分 析 开 始 。 当 前 我 
们 假设 程序 中 没有 方法 调用 。 然 后 , 我 们 描述 如 何在 计算 指针 指向 分 析 结果 的 同时 动态 地 构造 
调用 图 。 最 后 我 们 将 描述 一 个 处 理 上 下 文 相 关 性 的 方法 。 

12. 4.2 一 个 指针 和 引用 的 模型 

假设 我 们 的 语言 可 以 用 下 列 方式 来 表示 和 操作 引用 : 

1) 某 些 程序 变量 的 类 型 为 “指向 7 的 指针 ”或 “指向 7 的 引用 ”, 其 中 了 是 一 个 类 型 。 这 些 变 
量 可 以 是 静态 的 , 也 可 能 位 于 运行 时 刻 栈 中 。 我 们 简单 地 称 它们 为 交 量 。 

2) 有 一 个 对 象 的 堆 。 所 有 变量 都 指向 堆 中 的 对 象 , 不 指向 其 他 变量 。 这 些 对 象 称 为 堆 对 象 
(heap object) 。 

3) 一 个 堆 对 象 可 以 有 多 个 字段 (field) ,一 个 字段 的 值 可 以 是 指向 一 个 堆 对 象 的 引用 (但 是 不 
能 指向 一 个 变量 ) 。 

可 以 使 用 这 个 结构 很 好 地 对 Java ER, 我 们 将 在 例子 中 使 用 Java 的 语法 。 请 注意 , 在 对 C 
语言 建 模 时 这 个 结构 的 效果 就 不 太 好 , 因为 在 C 语言 中 指针 变量 可 以 指向 其 他 指针 变量 。 而 且 ， 
从 原则 上 讲 , 任何 C 语言 的 值 都 可 以 被 强制 转化 成 为 一 个 指针 。 

因为 我 们 进行 的 是 上 下 文 无 关 的 分 析 , 所 以 只 需要 断定 一 个 给 定 的 变量 v 能 够 指向 一 个 给 定 
WENA h, 不 需要 指出 在 程序 中 的 什么 地 方 v 可 能 指向 h, 或 者 在 什么 样 的 上 下 文中 " 可 以 指向 
ho WER, 变量 可 以 通过 它 的 全 名 来 命名 。 在 Java H, 这 个 全 名 包括 了 模块 、 类 ,方法 和 方法 中 
的 块 以 及 变量 名 本 身 。 因 此 , 我 们 可 以 区 分 标识 符 相 同 的 多 个 变量 。 

堆 对 象 没有 和 名字。 因为 可 能 动态 创建 出 无 限 多 个 对 象 , 所 以 人 们 经 常 使 用 近似 方式 给 对 象 
命名 。 一 个 惯例 是 使 用 创建 对 象 的 语句 来 指定 对 象 。 因 为 一 个 语句 可 以 被 执行 多 次 , 每 次 都 可 
以 创建 一 个 新 的 对 象 , 因此 一 个 形 如 “wv 可 以 指向 h” 的 断言 实际 上 是 说 %v 可 以 指向 标号 为 h 的 语 
名 创建 的 二 个 或 者 多 个 对 象 。 

分 析 的 目标 是 确定 各 个 变量 以 及 每 个 堆 对 象 的 各 字段 可 能 指向 哪些 对 象 。 我们 把 这 个 分 析 
称 为 指针 指向 分 析 (points-to analysis)。 如 果 两 个 指针 的 指向 集合 相交 , 那么 它们 互 为 别名 。 这 里 
我 们 描述 的 是 一 个 基于 包含 (inclusion-based) 的 分 析 技 术 。 也 就 是 说 , 一 个 形 如 v=w 的 语句 使 得 
变量 wv 指 向 w 所 指向 的 所 有 对 象 , 但 是 反 过 来 不 成 立 。 虽 然 这 个 方法 看 起 来 显而易见 , 但 我 们 还 
可 以 使 用 其 他 的 方法 来 定义 指向 分 析 。 比 如 , 我 们 可 以 定义 一 个 基于 等 价 关系 (equivalence- 
based) 的 分 析 , 使 得 形 如 v =w 的 语句 把 变量 v 和 w 转变 成 一 个 等 价 类 。 等 价 类 中 的 变量 指向 同 
样 的 对 象 。 虽 然 这 种 表示 法 不 能 很 好 地 估算 别名 问题 , 但 它 仍 然 为 哪些 变量 指向 同一 类 对 象 的 
问题 提供 了 一 个 快速 的 求解 方法 , 而 且 效 果 通 常 很 好 。 

12.4.3 ”控制 流 无 关 性 

我 们 首先 给 出 一 个 很 简单 的 例子 , 说 明 在 指针 指向 分 析 中 忽略 
控制 流 带 来 的 影响 。 

图 12-20 中 创建 了 三 个 对 象 h、i 和 j, 并 分 别 赋 给 变量 
a、b 和 c。 显 然 到 第 3 行 结束 的 时 候 , a 指向 h,b 指 向 i, ec 指向 jo 
如 果 接 着 分 析 语 句 4 ~6, 会 发 现在 第 4 行 之 后 , a 只 指向 i。 Æ 12-20. 例 12.22 的 

BS Za, b 只 指向 j。 第 6 行 之 后 c 只 指向 i 图 Java 代码 
上 面 的 分 析 是 控制 流 相 关 的 , 因为 我 们 沿 着 控制 流 计 算 了 在 每 个 语句 之 后 各 个 变量 会 指向 哪个 对 


new Object(); 
ew 0bject() ; 
ew Object(); 
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象 。 换 名 话说, 除了 考虑 各 个 语句 生成 哪些 指向 信息 之 外 , 我 们 也 考虑 了 每 个 语句 “ 杀 死 了 ”哪些 指向 
信息 。 比 如 , 语句 b =c; 杀 死 了 之 前 的 事实 “b 指向 ”并 生成 了 新 的 关系 “b 指向 。 所 指向 的 东西 ”。 

一 个 控制 流 无 关 分 析 忽 略 了 控制 流 。 这 么 做 实质 上 就 是 假设 被 分 析 程序 中 的 各 个 语句 可 以 
按照 任何 顺序 执行 。 它 只 计算 一 个 全 局 性 的 指向 映射 , 这 个 映射 指明 了 每 个 变量 在 程序 执行 的 
名 点 上 可 能 指向 哪些 对 象 。 如 果 一 个 变量 在 程序 中 两 个 不 同 语句 的 执行 之 后 指向 两 个 不 同 的 对 
象 , 我 们 只 记录 它 可 能 指向 这 两 个 对 象 。 换 名 话说 , 在 控制 流 无 关 分 析 中 , 任何 赋值 都 不 会 < 杀 
死 " 任 何 指向 关系 ,而 是 只 能 “生成 "更 多 的 指向 关系 。 为 了 计算 控制 流 无 关 分 析 的 结果 , 我 们 不 
断 向 指针 指向 关系 中 加 入 各 个 语句 的 效果 , 直到 无 法 找到 新 的 关系 为 止 。 显 然 ,缺乏 控制 流 相关 
性 大 大 弱化 了 分 析 的 结果 , 但 是 这 么 做 通常 可 以 降低 为 表示 分 析 结果 而 使 用 的 数据 的 大 小 , 并 使 
得 算法 更 快 地 收敛 。 
DEJ 加 到 例 12. ?2, 第 1 行 到 第 3 行 仍然 告诉 我 们 a 可 以 指向 h; 5 可 以 指向 i;c 可 以 指 
向 j。 根据 第 4 行 和 第 5 行 ,a 可 以 指向 h 和 ;6 可 以 指向 i 和 j。 根据 第 6 行 ,可 以 指向 太守 和 
j 这 个 信息 又 影响 了 第 5 行 ,接着 又 影响 了 第 4 行 。 最 后 , 我 们 只 得 到 一 个 没有 用 的 结论 ， 即 任 
何 指针 可 能 指向 任何 对 象 。 口 
12.4.4 在 Datalog 中 的 表示 方法 

现在 我 们 基于 上 面 的 讨论 把 一 个 控制 流 无 关 的 指针 别名 分 析 正 式 表示 出 来 。 现 在 忽略 过 程 
调用 , 并 将 关注 四 种 可 能 影响 指针 的 语句 ; 

1) RAE: h: Tv=new TO; ， 这 个 语句 创建 了 一 个 新 的 堆 对象 , 并 且 变 量 " 可 以 指向 它 。 

2) 复制 语句 ; v =w; ”这 里 v 和 w 是 两 个 变量 。 这 个 语句 使 得 ” 指向 w 当前 所 指 的 堆 对 象 ， 
BD w 被 复制 到 > 中 。 

3) 字段 保存 ; v 上 =w; 所 指向 的 对 象 类 型 必须 有 一 个 字段 几 并 且 这 个 字段 必须 是 某 一 
种 引用 类 型 。 令 v 指 向 堆 对 象 h, 并 令 w 指向 g。 这 个 语句 使 得 h 中 的 字段 现在 指向 g。 请 注 
意 , 变量 ;的 值 没有 改变 。 

4) 字段 读 取 : vow f; ”这 里 w 是 一 个 指向 某 个 具有 字段 /的 堆 对 象 的 变量 , 而 /指向 某 个 
堆 对 象 h。 这 个 语句 使 得 变量 v 指 向 h。 

请 注意 , 源 代码 中 的 复合 字段 访问 ,比如 v =w fo, 可 以 被 分 解 为 两 个 基本 的 字段 读 取 语句: 


vi = w.f; 
v-=vi.g; 


现在 , 我 们 把 这 个 分 析 用 Datalog 规则 正式 表示 出 来 。 首 先 ,， 只 需要 计算 两 个 IDB 断言 : 

1) pts(V, H) RRE V 可 能 指向 一 个 堆 对 象 H, 

2) hpts(H, F,，G) 表 示 堆 对 象 吾 的 字段 可 能 指向 堆 对 象 Co 

EDB 关系 根据 程序 本 身 构造 得 到 。 因 为 在 控制 流 无 关 的 分 析 中 , 程序 中 语句 的 位 置 和 分 析 无 关 ， 
所 以 只 需要 在 EDB 中 确定 程序 中 是 否 存在 某 种 形式 的 语句 。 在 接 下 来 的 内 容 中 , 我 们 将 做 一 个 方便 的 
简化 。 我 们 没有 定义 专门 的 EDB 关系 来 存放 从 程序 中 获取 的 信息 , 而 是 使 用 带 引号 的 语句 的 方式 来 指 
明 一 个 或 者 多 个 EDB 关系 。 这 些 关 系 表 示 程 序 中 存在 这 样 的 语句 。 比 如 ,“H:T V=new 7()" 是 一 个 
EDB 事实 , 它 表示 在 语句 五 中 有 一 个 赋值 使 得 变量 V 指 向 一 个 新 的 类 型 为 了 的 对 象 。 在 实践 中 , 我 们 
假设 有 一 个 对 应 的 EDB 关系 , 其 中 包含 的 基础 原子 和 程序 中 这 种 形式 的 语句 一 一 对 应 。 

根据 这 种 约定 , 我 们 在 编写 Datalog 程序 时 要 做 的 全 部 工作 就 是 为 上 面 的 四 种 语句 中 的 每 一 
种 写 出 一 个 规则 。 相 应 的 程序 在 图 12-21 中 给 出 。 规 则 1 说明 如 果 语 名 五 是 把 一 个 新 对 象 赋 给 V 
的 赋值 语句 , 变量 V 就 可 能 指向 堆 对 象 且 。 规则 2 说 明 如 果 存在 一 个 复制 语句 V=W, 并 且 下 可 
以 指向 五 ; 那么 V 也 可 以 指向 五 。 


594 #12% 











1) pis(V,H) :+ “H: TV =newT()” 


2) pts(V,H) :- VWE 
pts(W, H) 


3) Apis(H FG). oe Vb k 
pts(W,G) & 
pts(V, H) 


4) pis(VoH) re SV = MA 
pts(W,G) & 
hpts(G, F, H) 












图 12-21 控制 流 无 关 指针 分 析 的 Datalog 程序 


规则 3 说 明 , 如 果 存 在 一 个 形 如 V. F =W 的 语句 , 多 可 以 指向 C, 并且 V 可 以 指向 五, 那么 及 
的 字段 五 可 以 指向 G。 最 后 , 规则 4 说 明 , 如 果 存 在 一 个 形 如 V=W.F 的 语句 , WW 可 以 指向 CG, 并 
AG 的 字段 下 可 以 指向 已, 那么 V 可 以 指向 厂 。 请 注意 , pts 和 hpts 是 相互 递归 的 , 但 是 这 个 Data- 
log 程序 可 以 用 任何 一 个 在 12. 3. 4 节 中 讨论 的 迭代 算法 进行 求 值 。 
12.4.5 使 用 类 型 信息 


S. a; 
因为 Java 是 类 型 安全 的 ,变量 只 能 指向 和 它 的 声明 类 型 相 兼容 的 类 T b; 
型 。 比 如 , 把 一 个 属于 一 个 变量 的 声明 类 型 的 超 类 的 对 象 赋 给 这 个 变量 | IP 


将 引发 一 个 运行 时 刻 异常 。 考 虑 图 12-22 中 的 简单 例子 , 其 中 S 是 7 的 子 | I ny a 
2, WR p WH, 这 个 程序 将 引发 一 个 运行 时 刻 异 常 , 因为 a 不 能 被 赋予 | i 
一 个 类 型 为 了 的 对 象 。 这 样 , 因为 类 型 约束 的 原因 , 我 们 可 以 静态 地 断 
定 a 只 能 指向 而 不 能 指向 g。 

因此 , 我 们 在 分 析 技 术 中 引入 三 个 EDB 断言 。 这 些 断 言 反 映 了 被 分 
析 代 码 中 的 重要 类 型 信息 。 我 们 将 使 用 下 面 的 断言 : 

1) v7ype(V, 7) 表 示 变 量 V 被 声明 为 类 型 7。 

2) AType(H, 7) 表 示 堆 对 象 且 在 分 配 时 具有 类 型 7。 如果 一 个 被 创建 的 对 象 是 由 某 个 核心 代码 例 程 
返回 的 , 那么 有 可 能 不 能 精确 决定 它 的 类 型 。 此 时 , 被 创建 对 象 的 类 型 可 以 被 保守 地 设 定 为 所 有 可 能 的 
类 型 。 





图 12-22 具有 类 型 错 
误 的 Java 程序 





3) assignable(T，S) 表 示 类 型 为 5 的 对 象 可 以 被 i= “Hi TV = nev TO 
赋值 给 一 个 类 型 为 了 的 变量 。 这 个 信息 通常 是 从 程序 ESWT h 
中 子 类 型 的 声明 中 收集 的 , 同时 也 包含 了 关于 语言 Pa Ney 
预定 义 类 的 信息 。assignable(T, 7) 总 是 取 真 值 。 hTypel H, S) & 
我 们 可 以 修改 图 12-21 中 的 规则 , 使 得 只 有 当 E 
被 赋值 变量 被 赋予 的 堆 对 象 的 类 型 是 可 赋值 类 型 3) hpts(H,F,G) :- = lg 
时 才 可 以 进行 推理 。 新 的 规则 在 图 12-23 中 显示 。 oa ae 
我 们 首先 修改 规则 2。 新 规则 的 最 后 三 个 于 目 | wy ape 
标 表示 我 们 可 以 断定 V 可 以 指向 五 的 条 件 是 VY 和 o UAA 
堆 对 象 五 的 类 型 分 别 是 T 和 5, 并 且 类 型 为 8 的 对 fence ng 
象 可 以 被 赋 给 指向 类 型 了 的 变量 。 规 则 4 中 也 增加 hType(H, S) & 
了 一 个 类 似 的 附加 约束 。 请 注意 , 在 规则 3 中 没有 grenene 5) 


附加 约束 , 因为 所 有 的 保存 运算 必须 通过 变量 进 图 12-23 ”向 控制 流 无 关 指针 分 析 增加 类 型 约束 
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行 ,而 这 些 变量 的 类 型 已 经 被 检查 过 了 。 在 其 中 加 入 的 任何 类 型 约束 具 能 多 处 理 一 种 情况 ,， 即 基 
对 象 为 null 常量 的 情况 。 


12.4.6 12.4 节 的 练习 
练习 12. 4. 1: 在 图 12-24 F, h Ag 用 于 表示 新 创建 对 象 的 标号 , 它们 


不 是 代码 的 一 部 分 。 你 可 以 假设 类 型 为 7 的 对 象 有 一 个 字段 f。 使 用 本 节 
中 的 Datalog 规则 来 推导 出 所 有 可 能 的 pts 和 Apts 事实 。 
| 练习 12. 4. 2: 对 下 列 代码 


&: Ta = new TO); 
h: a=new T(); 图 12-24 练习 12.4.1 


Gun 的 代码 
应 用 本 节 中 的 算法 将 可 以 推导 出 a 和。 都 可 能 指向 h 和 g。 如 果 代 码 写 成 


g: Ta = new T(); 
h: T b= new TO; 
Tt ¢ 2 D 


我 们 就 能 够 精确 地 推导 出 a 可 能 指向 h, 且 5 和 < 可 能 指向 go 请 给 出 一 个 可 以 避免 这 种 不 精确 
情况 的 过 程 内 数据 流 分 析 技 术 。 

| 练习 12. 4; 3: 如 果 我 们 用 图 12-21 中 的 规则 2 所 描述 的 复制 运 
算 来 模拟 函数 调用 和 返回 操作 ,就 可 以 把 本 节 中 的 分 析 技 术 扩展 为 过 | SPSL ae, 
程 间 分 析 技术 。 也 就 是 说 ,一 个 调用 把 实在 参数 复制 到 相应 的 形式 参 sy 
数 中 ,而 函数 返回 运算 把 存储 返回 值 的 变量 复制 到 被 赋予 调用 结果 的 |) 
变量 中 。 考 虑 图 12-25 的 程序 。 

1) 对 这 个 代码 进行 控制 流 无 关 的 分 析 。 

2) 某 些 在 问题 1 中 做 出 的 推导 实际 上 是 “假冒 的 ”, 也 就 是 说 它们 
并 不 表示 任何 可 能 在 运行 时 刻 产 生 的 事件 。 这 个 问题 的 源头 可 以 追溯 
到 对 变量 5 的 多 次 赋值 。 改 写 图 12-25 中 的 代码 ,使 得 没有 变量 被 多 次 
赋值 。 对 修改 后 的 代码 再 次 分 析 , 说 明 每 个 推导 得 到 的 pis 和 hpts 的 事 图 12-25 ”指针 指向 分 析 
实 都 会 在 运行 时 刻 发 生 。 fare 
12.5 ”上下文 无 关 的 过 程 间 分 析 

现在 我 们 考虑 方法 调用 。 我 们 首先 解释 如 何 使 用 指针 指向 分 析 技术 来 获得 精确 的 调用 图 ， 
而 调用 图 又 可 以 用 于 计算 精确 的 指针 指向 分 析 结 果 。 然 后 , 我 们 正式 描述 如 何 动态 地 生成 调用 
图 , 并 说 明 如 何 用 Datalog 简洁 地 描述 这 个 分 析 过 程 。 

12.5.1 一 个 方法 调用 的 效果 

在 Java 中, 一 个 形 如 x=y. n(z) 的 方法 调用 对 指针 指向 关系 的 影响 可 以 计算 如 下 : 

1) 确定 接收 对 象 的 类 型 , 也 就 是 7 所 指向 对 象 的 类 型 。 假 设 它 的 类 型 是 1。 令 m 是 最 低 的 具有 名 
为 的 例 程 的 上 的 超 类 中 的 那个 名 为 ”的 例 程 。 请 注意 , 一 般 情况 下 只 能 动态 确定 被 调用 的 方法 。 

2) 方法 m 的 形式 参数 被 赋予 了 实在 参数 所 指向 的 对 象 。 实 在 参数 不 仅仅 包括 直接 传递 的 参 
数 ,也 包括 接收 对 象 本 身 。 每 个 方法 调用 把 接收 对 象 赋 给 this ES, RU this 变量 当 作 
各 个 方法 的 第 0 个 形式 参数 。 在 x =y. n(z) 中 有 两 个 形式 参数 : y 所 指向 的 对 象 被 赋 给 变量 
this, 而 z 所 指向 的 对 象 被 赋 给 m 中 声明 的 第 一 个 形式 参数 。 
















void main() { 
g: Tb = new T(); 

b = p(b); 

b= b.f; 













O 请 记 住 ,变量 是 通过 它们 所 属 的 方法 进行 区 分 的 ,因此 有 很 多 个 名 字 为 this 的 变量 ,程序 中 的 每 个 方法 有 一 个 
this 变量 。 
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3) 方法 m 的 返回 对 象 被 赋 给 这 个 赋值 语句 的 左 部 变量 。 

在 上 下 文 无 关 分 析 中 ， 参数 和 返回 值 都 由 复制 语句 建 模 。 尚 待 解决 的 一 个 有 意思 的 问题 是 
如 何 确 定 接收 对 象 的 类 型 。 我 们 可 以 根据 这 个 变量 的 声明 保守 地 确定 它 的 类 型 。 比如 , 被 声明 
变量 的 类 型 为 1, 那么 只 有 ;+ 的 某 个 子 类 型 中 名 字 为 n 的 方法 会 被 调用 。 遭 憾 的 是 , 如 果 被 声明 变 
量 的 类 型 为 Object, 那么 所 有 名 为 n 的 方法 都 是 可 能 的 调用 目标 。 在 密集 使 用 对 象 层次 结构 和 
包含 了 大 型 类 库 的 实际 程序 中 ， 这 个 方法 可 能 会 得 到 很 多 虚假 的 调用 目标 , 使 得 分 析 过 程 既 缓慢 
又 不 精确 。 

我 们 需要 知道 被 分 析 的 变量 可 能 指向 什么 样 的 对 象 ， 以 便 计算 出 调用 目标 。 但 是 , 除非 我 们 
知道 了 调用 目标 ， 否则 无 法 找 出 所 有 这 些 变量 会 指向 什么 样 的 对 象 。 这 个 递归 关系 要 求 我 们 在 
计算 指针 指向 集合 的 同时 找 出 调用 目标 。 这 个 分 析 需 要 不 断 进行 , 直到 找 不 到 新 的 调用 目标 和 
新 的 指针 指向 关系 为 止 。 

RE EE 12-26 的 代码 中 , r 是 : 的 一 个 子 类 , 而 s 


class t { 


未 身 又 是 ;的 二 个 子 类 。 如 果 只 使 用 声明 类 型 的 信息 进行 sah noe sehen som Oly 
分 析 ， a.n () 可 以 调用 在 上 述 代码 中 声明 的 三 个 名 为 n 的 class s extends t { 
方法 中 的 任何 一 个 , 因为 和 7 都 是 a 的 声明 类 型 :的 子 a 


类 型 。 不 仅 如 此 ， 看 起 来 在 第 5 行 之 后 a 可 以 指向 对 象 8、 class r extends s { 
nAi is : t n() { return new r(); } 

通过 分 析 程序 中 指针 指向 关系 , 我 们 首先 确定 a 可 以 | 
指向 而) 是 一 个 类 型 为 ! 的 对 象 。 因 此 , 第 1 行 中 声明 的 | ye erst ie 
方法 是 一 个 调用 目标 。 分 析 第 1 行 , 我 们 确定 a 也 可 能 指 | 5) a =a.n(); 
ig, T g 是 一 个 类 型 为 r 的 对 象 。 因 此 , 第 3 行 中 声明 的 
方法 也 可 能 是 一 个 调用 目标 , HRE a 可 能 也 指向 i, 而， E 12-26 一 个 虚拟 方法 调用 
是 另 一 个 类 型 为 r 的 对 象 。 因 为 没有 发 现 更 多 的 新 调用 目 
标 , 这 个 分 析 过 程 终止 了 。 它 既 没 有 分 析 第 2 行 中 声明 的 方法 , BA Wise a 可 能 指向 h。 国 
12.5.2 在 Datalog 中 发 现 调用 图 

为 了 写 出 上 下 文 无 关 的 过 程 间 分 析 的 Datalog 规则 ， 我 们 引入 三 个 EDB 断言 ; 每 个 断言 都 能 
够 从 源 代码 中 轻易 获得 : 

1) actual(S, 1, V) ÆR V 是 调用 点 S 上 的 第 1 个 实在 参数 。 

2) formal(M, 1, VRR V ÆTI M PEHR I 个 形式 参数 。 

3) cha(T, N, M) 表 示 在 一 个 类 型 为 7 的 接收 对 象 上 调用 N 时 实际 调用 的 方法 是 M(cha 是 
class hierarchy analysis( 类 层 次 结构 分 析 ) 的 缩写 ) 。 

调用 图 的 每 个 边 都 被 表示 为 一 个 IDB 断言 invokes。 当 我 们 找到 的 调用 图 的 边 越 来 越 多 时 , 根 
据 参数 被 传人 及 返回 值 被 传 出 的 情况 , 我 们 会 得 到 越 
来 越 多 的 指针 指向 关系 。 这 个 效果 被 总 结 为 图 12-27 
中 的 规则 。 

第 二 个 规则 计算 了 调用 点 的 调用 目标 。 也 就 是 
BL, “S: VNC...) "表明 存在 一 个 标号 为 S 的 调用 点 ， 
它 调用 了 由 了 指向 的 接收 对 象 的 名 为 W 的 方法 。 这 些 
子 目 标 表示 , 如 果 了 可 以 指向 实际 类 型 为 了 的 堆 对 象 
H, $E M 是 在 调用 7 类 型 的 对 象 时 所 使 用 的 方法 ， ”图 12-27 发 现 调用 图 的 Datalog 程序 














1) invokes(S,M) :- “S: VN(...)” & 
pts(V, H) & 

hType(H,T) & 

cha(T, N, M) 









invokes(S,M) & 
formal(M,I,V) & 
actual(S,I,W) & 

pts(W, H) 


过 程 间 分 析 = 





那么 调用 点 $ 可 能 调用 方法 M。 

第 二 个 规则 说 明 , 如 果 调 用 点 S 可 以 调用 方法 M, 那么 以 的 每 个 形式 参数 都 可 能 指向 本 次 调 
用 中 相应 的 实在 参数 所 指向 的 任何 对 象 。 处 理 返 回 值 的 规则 留 作 练习 请 读者 自行 完成 。 

把 这 两 个 规则 和 12. 4 节 中 解释 的 规则 组 合 起 来 , 我 们 就 建立 了 一 个 使 用 调用 图 的 上 下 文 无 
关 的 指针 指向 分 析 方 法 。 其 中 的 调用 图 是 在 分 析 的 同时 动态 生成 的 。 这 个 分 析 的 副作用 是 使 用 
上 下 文 无 关 和 控制 流 无 关 的 指针 指向 分 析 生 成 了 一 个 调用 图 。 相 对 于 那个 只 根据 类 型 声明 和 语 
法 分 析 得 到 的 调用 图 , 这 个 调用 图 要 精确 得 多 。 | 
12.5.3 ”动态 加 载 和 反射 

Java 这 样 的 语言 支持 类 的 动态 加 载 。 因 此 分 析 一 个 程序 执行 的 所 有 代码 是 不 可 能 的 , 也 就 不 
可 能 静态 地 给 出 任何 对 调用 图 和 指针 别名 的 保守 的 估算 。 静 态 分 析 只 能 基于 被 分 析 代 码 给 出 一 
个 近似 。 请 记 住 , 这 里 描述 的 所 有 分 析 都 可 以 在 Java 字 节 码 的 层次 上 应 用 , 因此 不 需要 检查 它们 
的 源 代码 。 这 个 选项 非常 重要 ,因为 Java 程序 常常 使 用 很 多 的 类 库 。 

即使 假设 已 经 分 析 了 所 有 被 执行 的 代码 , 还 有 一 个 更 加 复杂 的 机 制 使 得 我 们 不 可 能 进行 保 
守 分 析 : 反射 机 制 。 反 射 机 制 允 许 程序 动态 地 决定 将 要 创建 的 对 象 的 类 型 、 被 调用 的 方法 的 名 字 
以 及 被 访问 的 字段 名 。 这 些 类 型 、 方 法 和 字段 名 可 以 通过 计算 获得 , 也 可 以 根据 用 户 输入 获得 ， 
因此 一 般 情 况 下 唯一 可 能 的 近似 估算 就 是 假设 什么 都 有 可 能 。 

下 面 的 例子 给 出 了 反射 机 制 的 常见 用 法 : 
1) String className = ...; 

2) Class c = Class.forName(className) ; 

3) Object o = c.newInstance(); 

4) T t = (T) o; 
其 中 的 class 库 中 的 方法 forName 的 输入 是 一 个 包含 了 类 名 的 字符 串 , 它 返 回 这 个 类 。 方 法 
newInstance 返回 该 类 的 一 个 实例 。 对 象 "的 类 型 被 强制 转换 成 为 所 有 预期 类 的 超 类 7， 而 不 
是 直接 把 Object 当 作 o 的 类 型 。 Oo 

虽然 很 多 大 的 Java 应 用 使 用 反射 机 制 , 但 它们 通常 使 用 一 些 常 见 的 习惯 用 法 ,比如 例子 
12. 25 中 给 出 的 用 法 。 只 要 这 个 应 用 没有 重新 定义 类 加 载 器 , 我 们 就 可 以 在 知道 className 的 
值 时 指出 这 个 对 象 所 属 的 类 。 如 果 className 的 值 是 在 程序 中 定义 的 , AY Java 中 的 字符 串 是 
不 可 变 的 , 那么 知道 className 指向 什么 值 就 可 以 知道 这 个 类 的 名 字 。 这 个 技术 是 指针 指向 分 
析 的 另 一 个 应 用 。 如 果 className 的 值 是 基于 用 户 输入 的 , 那么 指针 指向 分 析 可 以 帮助 确定 这 
个 值 是 在 哪里 输入 的 , 而 开发 者 就 可 以 限定 这 个 值 的 取 值 范围 。 , 

类 似 地 , 我 们 可 以 利用 类 型 强制 转换 语句 ， 即 例子 12. 25 中 的 第 4 行 , 来 估算 动态 创建 的 对 
象 的 类 型 。 假 设 没 有 重新 定义 强制 类 型 转换 的 异常 处 理 程序 , 那么 这 个 对 象 必然 属于 类 型 7 的 
某 一 个 子 类 。 

12.5.4 12.5 节 的 练习 

练习 12. 5. 1: 对 于 图 12-26 中 的 代码 ， 

1) 构造 EDB 关系 actual, formal Fil cha, 

2) 推导 出 所 有 可 能 的 pts 和 hips 事实 。 

! 练习 12. 5.2: 你 将 如 何 向 12.5.2 节 中 的 EDB 断言 和 规则 中 加 入 附加 的 断言 和 规则 来 处 
理 下 面 的 情况 : 如 果 一 个 方法 调用 返回 了 一 个 对 象 , 那么 被 赋值 为 这 个 调用 结果 的 变量 可 能 指向 
任何 用 以 存放 返回 值 的 变量 所 指向 的 任何 对 象 。 
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12.6 上下文 相关 指针 分 析 


12. 1. 2 节 中 讨论 过 , 上 下 文 相关 性 可 以 大 大 提高 过 程 间 分 析 的 精确 性 。 我 们 讨论 了 两 种 过 
程 间 分 析 的 方法 , 一 种 基于 克隆 的 方法 ( 见 12.1.4 节 ) , 另 一 种 是 基于 摘要 的 方法 ( 见 12.1.5 
节 ) 那么 我 们 应 该 使 用 哪 一 个 方法 呢 ? 

在 计算 指针 指向 信息 的 摘要 时 有 儿 个 难点 。 首 先 , 这 些 摘要 很 大 。 每 个 方法 的 摘要 必须 包 
括 这 个 函数 和 所 有 被 调用 者 可 能 做 出 的 所 有 更 新 所 产生 的 影响 。 这 些 影 响 需要 用 输入 参数 来 表 
示 。 也 就 是 说 , 一 个 方法 可 能 改变 的 指向 集合 包括 : 所 有 可 通过 静态 变量 及 输入 参数 到 达 的 所 有 
数据 的 指向 集合 , 以 及 由 该 方法 及 被 调用 方法 所 创建 的 全 部 对 象 的 指向 集合 。 虽 然 人 们 已 经 给 
出 了 复杂 的 解决 方案 , 但 是 现在 还 没有 解决 方法 可 以 被 应 用 到 大 型 程序 中 。 即 使 摘要 可 以 通过 
自 底 向 上 的 方式 计算 得 到 , 但 如 何在 一 个 典型 的 自 顶 向 下 处 理 过 程 中 计算 所 有 上 下 文 环境 下 的 
指针 指向 集合 是 一 个 更 大 的 问题 。 因 为 上 下 文 环境 的 数量 可 能 按照 指数 级 增长 。 这 样 的 信息 对 
于 一 些 全 局 性 查询 是 必须 的 ， 比 如 在 代码 中 找 出 指向 某 个 特定 对 象 的 所 有 指针 。 

在 本 节 中 , 我 们 将 讨论 基于 克隆 的 上 下 文 相关 分 析 技术 。 基 于 克隆 的 分 析 直 接 为 每 个 感 兴趣 的 
上 下 文 都 给 出 一 个 对 应 方法 的 克隆 。 然 后 , 我 们 对 克隆 得 到 的 调用 图 进行 上 下 文 无 关 分 析 。 里 然 这 
个 方法 看 起 来 简单 ,但 最 大 的 难点 在 于 如 何 处 理 大量 克 隆 的 细节 。 有 多 少 个 上 下 文 ? 即使 我 们 像 
12. 1.3 中 讨论 的 那样 把 所 有 递归 调用 环 塌 缩 为 一 个 点 , 在 一 个 Java 应 用 中 找到 10 “个 上 下 文 的 情况 
也 并 不 少见 。 把 这 么 多 上 下 文 的 分 析 结 果 用 某 种 方式 表示 出 来 是 我 们 所 面临 的 挑战 。 

我 们 把 对 上 下 文 相关 性 的 讨论 分 成 两 个 部 分 : 

1) 如 何在 逻辑 上 处 理 上 下 文 相关 性 ? 这 个 部 分 较为 简单 , 因为 可 以 直接 对 克隆 得 到 的 调用 
图 应 用 上 下 文 无 关 的 分 析 算 法 。 

2) 如 何 表 示 指 数量 级 的 上 下 文 ? 方法 之 一 是 把 这 个 信息 表示 为 一 个 二 分 决策 图 (BDD)。 这 
是 一 个 经 过 高 度 优化 的 数据 结构 ,曾经 用 于 很 多 其 他 的 应 用 。 

这 个 处 理 上 下 文 相关 性 的 方法 很 好 地 说 明了 抽象 方面 的 重要 性 。 我 们 将 说 明 如 何 应 用 人 们 
多 年 来 在 BDD 抽象 方面 所 做 的 工作 来 消除 算法 的 复杂 性 。 我 们 可 以 用 很 少儿 行 Datalog 程序 来 表 
示 一 个 上 下 文 相关 的 指针 指向 分 析 。 而 这 个 程序 利用 了 已 有 的 几 千 行 用 于 BDD 数据 操作 的 代 
码 。 这 个 方法 具有 多 个 重要 的 优势 。 首 先 , 它 使 得 人 们 能 够 比较 容易 地 表示 那些 利用 指针 指向 
分 析 结 果 进 行 深度 分 析 的 技术 。 无 论 如 何 , 指针 指向 分 析 结果 本 身 并 不 令 人 感 兴趣 。 第 二 , 它 使 
得 正确 写 出 这 个 分 析 方 法 的 任务 变 得 容易 得 多 , 因为 它 利用 了 很 多 行经 过 充分 调试 的 代码 。 
12. 6. 1 上 下 文 和 调用 串 

下 面 描述 的 上 下 文 相 关 的 指针 指向 分 析 假设 我 们 已 经 计算 得 到 了 一 个 调用 图 。 这 个 假设 有 
助 于 我 们 使 用 紧凑 的 方式 来 表示 多 个 调用 上 下 文 。 为 了 得 到 调用 图 , 我 们 首先 运行 一 次 上 下 文 
无 关 的 指针 指向 分 析 过 程 。12. 5 节 讨论 过 , 这 个 分 析 过 程 同时 生成 了 调用 图 。 现 在 我 们 描述 如 
何 创建 克隆 的 调用 图 。 

调用 串 形成 了 活跃 的 函数 调用 的 历史 , 而 一 个 上 下 文 就 是 一 个 调用 串 的 表示 形式 。 田 一 个 
看 待 上 下 文 的 方法 是 把 它 看 作 一 个 调用 序列 的 摘要 。 这 些 调 用 的 活动 记录 当前 位 于 运行 时 刻 栈 
中 。 如 果 栈 中 没有 递归 函数 ,那么 这 个 调用 串 ( 即 调用 了 栈 中 函数 的 位 置 的 序列 ) 是 一 个 完全 表 
示 。 同 时 它 也 是 一 个 可 接受 的 表示 方式 , 因为 只 有 有 限 多 个 不 同 的 上 下 文 。 虽 然 上 下 文 的 个 数 
可 能 是 程序 中 函数 数量 的 指数 级 。 

但 如 果 程 序 中 存在 递归 函数 , 那么 可 能 的 调用 串 的 数目 是 无 穷 的 , 我 们 不 能 用 所 有 可 能 的 调 
用 串 来 表示 不 同 的 上 下 文 。 可 以 使 用 多 个 方法 来 限制 不 同 的 上 上下文 的 数目 。 比 如 , 我 们 可 以 编 
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写 一 个 描述 了 所 有 可 能 调用 串 的 正则 表达 式 , 然后 使 用 3.7 节 中 的 方法 把 这 个 表达 式 转化 成 为 一 
不 确定 的 有 穷 状 态 自动 机 。 之 后 , 各 个 上 下 文 就 可 以 使 用 这 个 自动 机 的 状态 来 标识 。 

这 里 ,我们 将 采用 一 个 更 简单 的 方案 , 它 包含 非 递归 调用 的 全 部 历史 , 但 是 把 递归 调用 当 作 
“难以 分 拆 ” 的 内 容 。 我 们 首先 找 出 程序 中 相互 递归 调用 的 函数 的 集合 。 这 个 过 程 很 简单 ,因此 
这 里 不 再 详细 讨论 。 考 虑 一 个 以 程序 中 各 个 函数 为 结 点 的 图 。 如 果 函 数 p 调用 了 函数 9， 那么 图 
中 就 存在 一 条 从 结 点 p 到 4 的 边 。 这 个 图 的 强 连通 分 量 (SCC) 就 是 相互 递归 调用 函数 的 集合 。 下 
面 的 这 个 特例 很 常见 。 一 个 函数 p 调用 了 它 自身 , 但 是 它 不 在 包含 了 其 他 函数 的 SCC 中 , 那么 函 
数 p 本 身 是 一 个 SCC，, 而 所 有 的 非 递归 函数 本 身 也 是 SCC。 如 果 一 个 SCC 具有 多 个 成 员 ( 即 相互 
递归 调用 的 情况 ), 或 者 它 包含 唯一 一 个 递归 成 员 , 我 们 就 说 这 个 SCC E E-P ILH (nontrivial), 
单个 非 递归 函数 组 成 的 SCC 是 平凡 SCC, 

前 面 有 一 个 规则 说 任何 调用 串 都 是 一 个 上 下 文 , 我 们 对 这 个 规则 做 如 下 修改 。 给 定 一 个 调 
HE, 如 果 下 面 情况 成 立 就 删除 一 个 调用 点 * 的 出 现 : 

1) :在 一 个 函数 p 中 。 

2) 函数 g 在 调用 点 处 被 调用 (有 可 能 g =p) 

3) p 和 4 位 于 同一 个 强 连 通 分 量 中 ( 即 和 g 相互 递归 调用 , 或 者 p =g E p 是 递归 函数 ) 。 

这 么 做 的 结果 是 , 当 一 个 非 平 凡 SCC 的 成 员 $ 被 调用 时 , 这 个 调用 的 调用 点 变 成 了 上 下 文 的 
一 部 分 , 但 是 在 S 中 对 同一 SCC 中 其 他 函数 的 调用 都 不 在 这 个 上 下 文中 。 最 后 , 当 一 个 5 之 外 的 
调用 发 生 时 , 我 们 把 该 调用 点 记录 为 这 个 上 下 文 的 一 部 分 。 

DEJ 四 12-28 中 给 出 了 五 个 函数 的 略图 , 图 中 给 出 了 一 些 调用 点 和 这 些 函 数 中 的 调用 。 


检查 一 下 这 些 调用 就 会 发 现 ,g 和 7 是 相互 递归 的 。 但 是 p、s Alt 
根本 不 会 递归 调用 。 因 此 , 我 们 的 上 下 文 将 是 除了 s3 和 s5 之 外 
的 所 有 调用 点 的 列表 。 函 数 4 和 r 之 间 的 递归 调用 就 发 生 在 s3 
和 s5 处 。 
让 我 们 考虑 从 p 到 :+ 的 所 有 路 径 , 也 就 是 所 有 调用 了 i 的 上 下 文 : 
1) p 可 以 在 s2 处 调用 s, 然后 s 可 以 在 s7 或 者 s8 处 调用 i。 
因此 , 两 个 可 能 的 调用 串 是 (s2, s7) 和 (s2, s8)。 


void p() { 
h:a = new T(); 
si: T b= q(a); 
s2: s(b); 


2) p 可 以 在 sl 处 调用 g。 然 后 , q Mr 可 以 多 次 递归 地 调用 
对 方 。 我 们 把 这 个 环 打开 : 

D E s4 处 , t 直接 被 调用。 这 个 选择 可 以 得 到 了 唯一 的 上 
下 文 (81, 84)% 

@ 在 s6 处 ,7 调用 s。 这 里 , 我 们 可 以 通过 在 s7 处 或 s8 处 
的 调用 到 达 t。 这么 做 给 出 了 两 个 新 的 上 下 文 (s1，s6，s7 ) 和 
(s1155, sb). 

Aut, 总 共有 五 个 不 同 的 上 下 文 调用 了 1。 请 注意 , 所 有 这 些 
上 下 文 都 省 略 了 递归 调用 点 s3 和 s5。 比 如 ,上 下 文 (s1, s4) 
实际 上 表示 了 对 应 于 调用 串 (s1,，83,，(s5,，s3)"，s4) 的 无 穷 集 
a, EH n0, E 

现在 我 们 描述 一 下 如 何 得 到 克隆 调用 图 。 每 一 个 被 克隆 的 方法 
都 使 用 程序 中 的 方法 M 和 一 个 上 下 文 C 来 标识 。 在 原 调用 图 的 边 上 
加 上 相应 的 上 下 文 就 可 以 得 到 克隆 后 的 调用 图 的 边 。 请 注意 , 在 原 调 


return d; 


J 


T ATL 


s5: T e = q(x); 


void s(T y) { 
sr: T f = t(y); 
s8: lf Sit); 
上 


Gm 
j: T g = new TO; 
return g; 


} 





图 12-28 “与 一 个 运行 实 
例 对 应 的 函数 和 调用 点 


600 Z 12% 





用 图 中 有 一 条 连接 调用 点 5 和 方法 M 的 边 的 条 件 是 断言 invokes(S, M) 为 真 。 为 了 增加 上 下 文 以 标识 
克隆 调用 图 中 的 例 程 ; 我 们 可 以 定义 一 个 相应 的 断言 CSinvokes , CSinvokes(S, C, M, D) 为 真 的 条 件 是 
EFX C 中 的 调用 点 3 调用 了 方法 必 的 上 下 文 D。 

12.6.2 在 Datalog 规则 中 加 入 上 下 文 信息 





为 了 找 出 上 下 文 相关 的 指针 指向 关系 , 我 们 have Saye me DOr 
可 以 直接 把 相同 的 正 下 文 无 关 指 针 指 向 分 析 技 术 1 
应 用 到 克隆 的 调用 图 上 。 因为 在 这 个 克隆 的 调用 Ba a 
图 中 的 方法 是 用 原 方法 和 它 的 上 下 文 来 表示 的 ， pts(W,C, H) 
我 们 相应 地 修正 了 所 有 的 Datalog 规则 。 为 简单 起 hpts(H, FPG) :VP=W"& 
见 , 下 面 的 规则 不 包括 类 型 约束 , 且 符号 ” “表示 ena 
了 任何 新 的 变量 。 

IDB 断言 ps 中 必须 增加 一 个 表示 上 下 文 的 参 Be NT TF 
Heo WR ps(V, C, 四 表示 上 下 文 C 中 的 变量 了 hpts(G, F, M) 
可 以 指向 堆 对 象 五。 所 有 这 些 规则 都 是 不 解 自明 al Diy SR C00.) 
的 , 但 规则 5 是 一 个 例外 。 规 则 5 表示 , 如 果 上 下 formal(M,I,V) & 
文中 的 调用 点 调用 了 上 下 文 D 的 方法 M, W Pe ae ae 
AERC D HIE M 的 形式 参数 可 能 指向 由 上 下 
X C 中 的 相应 实在 参数 指向 的 对 象 。 图 12-29“” 上 下 文 相关 的 指针 指向 分 析 的 Datalog 图 


12.6.3 关于 相关 性 的 更 多 讨论 

上 面 我 们 描述 的 是 一 个 上 下 文 相关 性 的 公式 化 表示 。 这 个 方法 已 经 体现 出 实用 性 。 使 用 下 
一 节 将 要 描述 的 一 些 技巧 ; 它 就 能 够 处 理 很 多 真实 的 大 型 Java 程序 。 虽 然 如 此 , 这 个 算法 还 是 不 
能 处 理 最 大 型 的 Java 应 用 。 

在 这 个 表示 方法 中 , 堆 对 象 是 通过 它们 的 调用 点 来 命名 的 , 但 是 却 不 具有 上 下 文 相关 性 。 这 
个 简化 处 理 可 能 引起 一 些 问题 。 考 虑 一 下 对 象 工 厂 设 计 设 计 模 式 ， 这 个 设计 模式 中 同一 类 型 的 
所 有 对 象 都 由 同一 个 例 程 分 配 。 当 前 的 表示 方案 会 使 得 那个 类 的 所 有 对 象 都 共享 同一 个 名 字 。 
应 对 这 一 情况 的 比较 容易 的 方法 是 把 相应 的 对 象 创建 代码 进行 实质 上 的 内 联 处 理 。 在 处 理 更 具 
一 般 性 的 情况 时 , 我 们 期 望 提高 对 象 命名 的 上 下 文 相关 性 。 虽 然 
很 容易 向 Datalog 规则 中 加 入 对 象 的 上 下 文 相关 信息 , 但 是 要 使 得 
相应 的 分 析 方法 能 够 被 用 于 大 规模 程序 则 是 另 一 个 问题 了 。 

另 一 个 相关 性 的 重要 形式 是 对 象 相关 性 。 一 个 对 象 相关 的 技 
术 可 以 区 分 在 不 同 的 接收 对 象 上 调用 的 方法 。 我 们 考虑 一 下 这 样 
的 场景 : 在 某 个 调用 点 所 处 的 上 下 文中 有 一 个 变量 可 能 指向 同一 
个 类 的 两 个 不 同 的 接收 对 象 。 这 两 个 不 同 的 接收 对 象 的 字段 可 能 
指向 不 同 的 对 象 。 如 果 不 区 分 接收 对 象 , 在 由 this 对 象 引用 的 
字段 之 间 的 复制 语句 将 产生 虚假 的 指向 关系 , 除非 我 们 对 不 同 的 
接收 对 象 分 别 进行 分 析 。 在 有 些 分 析 中 ， 对 象 相关 性 要 比 上 下 文 
相关 性 更 加 有 用 。 
12.6.4 12.6 节 的 练习 

练习 12. 6. 1: 如 果 我 们 把 本 节 中 的 方法 应 用 到 图 12-30 中 的 ”图 二 30 练习 12.6.1 和 练习 
代码 上 , 我 们 能 够 区 分 的 上 下 文 有 哪些 ? 12.6.2 BfREE 

















void p() { 
h: T a= new TQ); 

i: T b = new TQ); 

cils co=q(ayb); 


T . paix, Tat 
j: T d = new T(); 
C2? a i= q(x,d); 
c3: d = q(d,y); 
c4: da = r(d); 
return d; 


T BCLS 
return Z; 
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| 练习 12.6.2: 对 图 12-30 中 的 代码 进行 上 下 文 相 关 性 分 析 。 
| 练习 12.6.3: 按照 12.5 节 中 的 方法 , 扩展 本 节 中 的 Datalog 规则 , 使 之 包含 类 型 和 子 类 型 信息 。 


12.7 使 用 BDD 的 Datalog 的 实现 


二 分 决策 图 ( Binary Decision Diagram, BDD) 是 一 个 用 图 来 表示 布尔 函数 的 方法 。 因 为 对 n 个 
恋 量 有 22" 个 布尔 函数 ,没有 哪 种 表示 方法 能 够 很 简洁 地 表示 所 有 的 布尔 函数 。 但 是 , 在 实践 中 
出 现 的 布尔 函数 常常 具有 很 多 规律 。 因 此 ， 人 们 常常 可 以 找到 一 个 BDD 来 简洁 地 表示 他 们 想 要 
表示 的 布尔 函数 。 

我 们 为 了 分 析 程 序 而 开发 了 一 些 Datalog 程序 。 事 实 表明 , 用 这 些 Datalog 程序 描述 的 布尔 函 
数 也 不 例外 ,也 可 以 使 用 BDD 简洁 地 表示 。BDD 方法 在 实践 中 是 相当 成 功 的 , 虽然 我 们 需要 通 
过 商业 BDD 操作 程序 包 中 的 一 些 启发 式 规则 或 技术 才 可 以 找到 用 以 表示 程序 信息 的 简洁 的 
BDD。 值 得 一 提 的 是 , 它 比 使 用 传统 数据 库 管理 系统 的 方法 具有 更 好 的 性 能 ， 因 为 传统 数据 库 管 
理 系统 是 为 了 在 典型 商业 数据 中 出 现 的 更 加 不 规则 的 数据 模式 而 设计 的 。 

讨论 经 过 多 年 开发 才 得 到 的 所 有 BDD 技术 已 经 超出 了 本 书 的 范围 。 我 们 将 在 这 里 介绍 BDD 的 
表示 方法 。 然 后 , 指出 如 何 把 一 个 关系 数据 表示 成 为 BDD。 在 用 诸如 算法 12. 18 的 算法 来 执行 Dat- 
alog 程序 时 需要 进行 某 些 运算 。 我 们 也 指出 了 如 何 操作 BDD 来 完成 这 些 运算 。 最 后 , 我 们 描述 了 如 
何在 BDD 中 表示 指数 量 级 的 上 下 文 。 这 种 表示 法 是 在 上 下 文 相关 性 分 析 中 成 功 应 用 BDD 的 关键 。 
12. 7.1 二 分 决策 图 

二 个 BDD 把 一 个 布尔 函数 表示 成 为 一 个 带 根 的 DAG 图。 这 个 DAG 的 每 个 内 部 结 点 都 用 被 
表示 函数 的 一 个 变量 作为 标号 。 在 图 的 底部 是 两 个 叶子 ,一 个 标号 为 0, 另 一 个 标号 为 1。 每 个 
内 部 结 点 有 两 条 指向 子 结 点 的 边 , 这 两 条 边 分 别称 为 低 边 "和 “高 边 ”"。 低 边 对 应 于 该 结 点 对 应 
变量 取 值 为 0 时 的 情况 ,而 高 边 对 应 于 相应 变量 取 值 为 1 时 的 情况 。 

给 定 这 些 变量 的 二 个 真 假 赋值 , 我 们 可 以 从 DAG 的 根 开始 确定 函数 的 取 值 。 在 每 个 结 点 上 ， 

比如 说 标号 为 x 的 结 点 上 ， 分别 根 据 x 的 真 假 值 为 0 或 1 来 决定 沿 着 相应 的 低 边 或 高 边 前 进 。 如 
果 我 们 最 后 到 达标 号 为 1 的 叶 结 点 ,那么 被 表示 的 函数 对 于 这 个 真 假 赋值 取 真 值 , 否则 该 函数 取 
假 值 。 
PRP 在 图 12.31 中 ,我 们 看 到 一 个 BDD。 稍 后 会 看 到 它 所 表示 的 函数 。 请 注意 , RME 
把 所 有 的 “ 低 ” 边 标记 为 0, 所 有 的 “高 " 边 标 记 为 1。 考 虑 对 于 变量 wy 的 真 假 赋值 : w = x = y 
-0 z=1。 从 根 结 点 开始 , 因为 w=0, 我 们 选取 低 边 , 从 而 走 到 最 左 的 标号 为 + 的 结 点 。 因 为 
x -0 我 们 还 是 从 这 个 结 点 沿 着 低 边 到 达 最 左 的 标号 为 y 的 结 点 。 因 为 y=0, 我 们 下 一 步 移动 到 
最 左 的 标号 为 :的 结 点 。 现 在 , 因为 z=1, 我 们 将 选择 高 边 并 最 后 到 达标 号 为 1 的 叶子 结 点 。 我 
们 的 结论 是 , 这 个 函数 相对 于 这 个 真 假 赋值 取 真 值 。 

现在 考虑 真 假 赋值 wyz =0101, 也 就 是 说 w=y=0, * =z=1。 我 们 还 是 从 根 结 点 开始 。 因 为 
w =0, 我 们 还 是 移动 到 最 左边 的 标号 为 * 的 结 点 。 但 这 一 次 因为 +=1, 我 们 沿 着 高 边 直 接 跳 到 叶子 
结 点 0。 也 就 是 说 , 我 们 不 仅 知道 真 假 赋值 0101 使 得 这 个 函数 为 假 , 而 且 因为 不 需要 查看 y 或 者 = 
的 值 .任何 形 如 01yz 的 真 假 赋值 都 会 使 得 这 个 函数 取 值 为 0。 这 个 “短路 "能 力 是 BDD 成 为 布尔 函 
数 的 简洁 表示 方法 的 理由 之 一 。 A 

图 12.31 中 内 部 结 点 分 为 多 个 层次 一 一 每 个 层 中 的 结 点 都 使 用 同一 个 特定 的 变量 作为 标号 。 
虽然 这 并 不 是 一 个 绝对 的 要 求 , 但 把 我 们 的 讨论 范围 限制 在 排序 BDD 之 内 会 带 来 方便 。 在 一 个 
排序 BDD 中 , 相应 的 变量 有 一 个 排序 1 ,wz，…, sn, 并 且 不 论 何 时 有 一 条 从 标号 为 *; 的 父 结 点 
到 标号 为 的 子 结 点 的 边 就 意味 着 i<j。 我 们 将 看 到 ,操作 排序 BDD 相对 容易 , 并 且 从 现在 开 
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始 我 们 假设 所 有 的 BDD 都 是 排序 的 。 





图 1231 一 个 一 分 关 生 图 


还 需要 注意 的 是 , BDD 是 有 向 无 环 图 (DAG) ,而 不 是 树 。 不 仅仅 叶子 结 点 0 和 1 通常 有 很 多 
父 结 点 ; 内 部 结 点 也 可 能 具有 多 个 父 结 点 。 比 如 , 在 图 12-31 中 最 右 的 标号 为 z 的 结 点 有 两 个 父 
结 点 。 把 得 到 同样 结果 的 多 个 结 点 合并 起 来 也 是 BDD 通常 比较 简洁 的 理由 之 一 。 
12.7.2 对 BDD 的 转换 

在 上 面 的 讨论 中 , 我 们 提 到 了 两 个 简化 BDD 的 方法 , 它们 可 以 使 得 BDD 更 加 简洁 : 

1) 短路 : 如 果 一 个 结 点 入 的 低 边 和 高 边 都 到 达 同 一 个 结 点 必 , 那么 我 们 可 以 消除 NN。 原 来 
HA N WAEREA Mo 

2) 结 点 合并 : 如 果 两 个 结 点 W AM 的 两 条 低 边 都 到 达 同 一 个 结 点 ,并且 两 条 高 边 也 到 达 同 
一 个 结 点 ,那么 我 们 可 以 把 N AM QF. ORBEA N RE M 的 边 都 进入 合并 后 的 结 点 。 

也 可 以 在 相反 的 方向 上 进行 这 两 个 转换 。 特 别 地 , 我 们 可 以 在 从 N 到 MM 的 边 上 引入 一 个 结 
点 。 从 引入 结 点 流出 的 高 边 和 低 边 都 到 达 结 点 KK， 而 原来 从 W 到 M 的 边 现在 到 达 这 个 刚 被 引信 
的 结 点 。 但 是 请 注意 , 新 结 点 的 标记 变量 必须 是 按照 排序 处 于 NN 和 M 之 间 的 某 一 个 变量 。 
图 12-32 给 出 了 这 两 个 转换 的 图 示 。 





© 
es 
es 
© 
a) 短路 b) 结 点 合并 


Æ 12-32 BDD 的 转换 
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12. 7.3 用 BDD 表示 关系 

我 们 至 今 为 止 处 理 的 关系 都 具有 从 “ 域 " 中 取 值 的 分 量 。 一 个 关系 的 某 个 分 量 的 域 是 该 关系 
的 各 个 元 组 的 相应 分 量 的 可 能 取 值 的 集合 。 比 如 , 关系 pis(V, 及) 的 第 一 个 分 量 的 域 为 所 有 程序 
变量 , 而 第 二 个 分 量 的 域 为 所 有 对 象 创建 语句 。 如 果 一 个 域 具有 多 于 2”! 个 可 能 取 值 且 不 多 于 
2" 个 可 能 值 , 那么 它 需 要 ”个 二 进 制 位 (或 者 说 布尔 变量 ) 来 表示 这 个 域 中 的 值 。 

因此 , 我 们 可 以 用 一 组 布尔 变量 来 表示 关系 元 组 的 各 个 分 量 的 域 中 的 值 。 关 系 的 一 个 元 组 
可 以 被 看 作 是 这 组 布尔 变量 的 真 假 赋值 。 我 们 可 以 把 关系 看 作 是 这 组 布尔 变量 上 的 一 个 布尔 函 
数 。 该 函数 对 于 某 个 真 假 赋值 返回 真 值 ， 当 且 仅 当 这 个 赋值 表示 了 此 关系 中 的 一 个 元 组 。 下 面 
的 例子 可 以 说 明 这 个 想法 。 
UE 考虑 个 关系 r(4,8) ,其 中 不 和 了 的 域 都 是 |a, b, c,d| 。 我 们 将 把 二 进 制 位 00 
作为 a 的 编码 , 01 对 应 于 b, 10 对 应 于 c 以 及 11 对 应 于 do ERA r 的 元 组 为 : 


B 
b 


C 


& e Sj 


C 


我 们 使 用 布尔 变量 wx 来 对 第 一 个 分 量 (4) 进行 编码 , 使 用 变量 yz 为 第 二 个 分 量 (B) 进行 编 
码 。 那 么 关系 -就 变 成 了 : 





也 就 是 说 ,关系 被 转换 成 为 一 个 对 三 个 真 假 赋值 wxyz =0001、0010 和 1110 取 真 值 的 布尔 
函数 。 请 注意 , 这 三 个 二 进 制 序列 恰巧 就 是 图 12-31 中 从 根 结 点 到 达 叶 子 结 点 1 的 路 径 上 的 标 
号 。 也 就 是 说 , 如 果 使 用 上 述 编码 方法 , 在 那个 图 中 的 BDD 表示 了 这 个 关系 r。 口 
12.7.4 用 BDD 操作 实现 关系 运算 

现在 , 我 们 看 到 了 如 何 把 关系 表示 成 BDD。 但 是 , 要 实现 像 算 法 12. 18( Datalog 程序 的 增 量 
式 求 值 ) 那 样 的 算法 , 我 们 还 需要 能 够 操作 BDD 以 反映 相应 关系 上 的 运算 。 下 面 给 出 了 我 们 要 完 
成 的 主要 的 关系 运算 : 

1) 初始 化 : 我 们 需要 创建 一 个 BDD 来 表示 一 个 关系 的 单个 元 组 。 我 们 将 通过 合并 运算 把 这 
些 表示 单个 元 组 的 BDD 集成 到 表示 大 型 关系 的 BDD 中 去 。 

”2) 合并 : 为 了 表示 关系 的 合并 , 我 们 使 用 布尔 函数 的 逻辑 OR 运算 来 表示 得 到 的 关系 。 这 个 
运算 不 仅 用 来 构造 初始 关系 ; 也 用 于 把 具有 相同 头 断言 的 多 个 规则 的 结果 合并 起 来 , 还 会 用 于 把 
新 的 断言 事实 合并 到 老 事 实 的 集合 中 去 。 算 法 12. 18 要 求实 现 这 些 运 算 。 

3) 投影 : 当 我 们 对 一 个 规则 体 求 值 的 时 候 , 我 们 需要 构造 出 由 那些 使 得 规则 体 取 真 值 的 元 
组 所 蕴含 的 头 断 言 的 关系 。 从 表示 这 个 关系 的 BDD 的 角度 来 说 , 我 们 需要 消除 其 中 的 一 些 结 点 ， 
这 些 结 点 的 布尔 变量 标号 没有 用 来 表示 头 关 系 中 的 分 量 。 我 们 可 能 还 需要 对 BDD 中 的 某 些 变量 
重新 命名 ， 以 使 得 它们 和 头 关 系 分 量 的 布尔 变量 相对 应 。 

4) 连接 : 为 了 找 出 令 一 个 规则 体 为 真 的 变量 的 赋值 组 合 , 我 们 需要 把 对 应 于 各 个 子 目标 的 关系 
“连接 ”起 来 。 比 如 , 假设 我 们 有 两 个 子 目 标 r(4, B)&s(B, C)。 这 些 子 目标 的 关系 的 连接 是 满足 下 列 
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条 件 的 三 元 组 (a, b, c) 的 集合 :(a, 5) 是 7 的 关系 中 的 一 个 元 组 , HC, 0) 是 5 的 关系 的 一 个 元 组 。 我 
们 将 看 到 , 在 对 BDD 中 的 布尔 变量 重新 命名 , 使 得 对 应 于 两 个 了 分量 的 变量 同名 之 后 ， 这 个 BDD 操作 
AWA AND 运算 类 似 , 而 逻辑 AND 运算 和 在 BDD 上 实现 关系 合并 的 逻辑 OR 运算 类 似 。 

单一 元 组 的 BDD 

为 了 初始 化 一 个 关系 , 我 们 需要 使 用 一 种 方法 来 为 那些 只 对 单个 真 假 赋值 取 真 值 的 函数 构 
造 BDD。 假 设 布尔 变量 为 si, x e, Xn, 并 且 这 个 唯一 的 真 假 赋值 为 a1a3…a, 其 中 每 个 a; 是 
0 或 1。 相 应 的 BDD 对 于 每 个 xi 有 一 个 结 点 Ni。 如 果 a; =0, 那么 Wi 的 高 边 直接 到 达 叶 子 结 点 
0, 而 低 边 到 达 结 点 Nii, 或 在 i=n 时 到 达 叶 子 1。 如 果 ui =1, 我 们 进行 同样 的 处 理 ， 只 是 高 边 
和 低 边 顺序 相反 。 

这 个 策略 给 出 了 一 个 BDD, 它 能 够 检查 每 个 x;(i=1, 2, …, n 是否 具有 正确 的 值 。 -HI 
到 不 正确 的 值 , 我 们 就 直接 跳 转 到 叶子 结 点 0。 只 有 当 所 有 变量 的 取 值 都 正确 时 , 我 们 才 会 在 最 
后 到 达 叶 子 结 点 1 处。 

作为 例子 , 可 以 回 到 前 面 的 图 12-33b。 这 个 BDD 表示 了 一 个 当 且 仅 当 x =y=0( 即 真 假 赋 值 
为 00 时 ) 才 取 真 值 的 函数 。 

合并 

我 们 将 详细 地 给 出 一 个 算法 来 计算 BDD 的 逻辑 OR, 也 就 是 这 两 个 BDD 所 表示 的 关系 的 
合并 8 


BDD 的 全 并。 

输入 : 两 个 排序 的 BDD, 它们 的 变量 集合 相同 , 且 排序 也 相同 。 

输出 : 一 个 BDD, 它 表 示 的 函数 是 两 个 输入 BDD 所 表示 的 布尔 函数 的 逻辑 OR 

方法 : 我 们 将 描述 一 个 合并 两 个 BDD 的 递归 过 程 。 这 个 过 程 按照 BDD 中 出 现 的 变量 集合 的 
大 小 进行 归纳 。 

归纳 基础 : 零 个 变量 。 这 两 个 BDD 必然 都 是 叶子 结 点 ; 其 标号 是 1 或 0。 如 果 两 个 输入 中 有 一 个 
是 1, 那么 输出 就 是 标号 为 1 的 叶子 结 点 ; 如 果 两 个 输入 都 是 0, 那么 输出 叶子 结 点 的 标号 是 0。 

归纳 步骤 ; 假设 两 个 BDD 中 总 共 出 现 了 上 个 变量 yi ,yy，…; Yeo 执行 下 列 步 又 : 

1) 如 果 必要 ,使 用 反 向 的 短路 转换 加 入 一 个 新 的 根 ,使 得 两 个 BDD 的 根 的 标号 都 是 is 

2) 设 两 个 BDD 的 根 为 N ALM, 令 它 们 的 低 边 子 结 点 分 别 为 No 和 Mo, 它们 的 高 边 子 结 点 分 
别 为 Ni 和 Mi。 对 分 别 以 No 和 Mo 为 根 的 两 个 BDD 递归 地 应 用 这 个 算法 。 同 时 也 对 分 别 以 入 
和 Mi 为 根 的 两 个 BDD 应 用 这 个 算法 。 在 得 到 的 两 个 BDD 中 ,第 一 个 BDD 表示 的 函数 取 真 值 的 
条 件 是 : 相应 的 真 假 赋值 中 y, =0, 并 且 它 使 得 两 个 输入 BDD 中 的 一 个 或 全 部 取 真 值 。 第 二 个 
BDD 表示 同样 的 函数 ,不 过 其 中 的 yi = 1。 

3) 创建 一 个 新 的 标号 为 yi 的 根 结 点 。 它 的 低 边 子 结 点 是 通过 递归 构造 得 到 的 第 一 个 BDD 
的 根 结 点 ,而 它 的 高 边 子 结 点 是 第 二 个 BDD 的 根 结 点 。 

4) 在 刚刚 通过 合并 得 到 的 BDD 中 把 两 个 标号 为 0 的 叶子 结 点 合并 ,同时 把 两 个 标号 为 1 的 
叶子 结 点 合并 。 

5) 在 可 能 的 时 候 应 用 合并 和 短路 转换 , 简化 得 到 的 BDD。 m 
在 图 12-33a 和 图 12-33b 中 有 两 个 简单 的 BDD。 第 一 个 BDD 表示 函数 x OR y, 而 第 
二 个 BDD 表示 函数 

NOT x AND NOT y 
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a) b) c) 
Æ 12-33 ”为 逻辑 OR 构造 BDD 


请 注意 , 它们 的 逻辑 OR 的 结果 是 常量 函数 1， 即 永 真 函数 。 对 这 两 个 BDD 应 用 算法 12.29 
时 , 我 们 考虑 两 个 根 的 低 边 子 结 点 和 它们 的 高 边 子 结 点 。 我 们 先 考虑 后 者 。 

在 图 12-33 中 , 根 的 高 边 子 结 点 是 1， 而 在 图 12-33b 中 的 相应 子 结 点 是 0。 因 为 这 两 个 子 结 
点 都 在 叶子 层次 上 , 所 以 不 需要 在 每 条 边 上 插入 标号 为 y 的 结 点 , 尽管 我 们 这 么 做 会 得 到 同样 的 
结果 。 结 点 0 和 1 的 合并 是 算法 中 归纳 基础 的 情况 , 合并 后 生成 一 个 标号 为 1 的 叶子 结 点 。 这 个 
叶子 结 点 将 成 为 新 的 根 结 点 的 高 边 结 点 。 

图 12-33. 和 图 12-33b 中 的 根 的 低 边 结 点 的 标号 都 是 y, 因此 我 们 递归 地 计算 它们 的 合并 
BDD。 这 两 个 结 点 的 低 边 子 结 点 的 标号 分 别 为 0 和 1, 因此 它们 的 低 边 子 结 点 的 合并 是 标号 为 1 
的 叶子 结 点 。 当 我 们 加 入 新 的 根 结 点 x* 后 , 我 们 得 到 图 12-33c 中 的 BDD, 

我 们 还 没有 完成 , 因为 图 12-33c 还 可 以 进一步 简化 。 标 号 为 y 的 结 点 的 两 个 子 结 点 都 是 结 
点 1, 因此 我 们 可 以 把 结 点 y 删除 , 并 把 1 当 作 根 结 点 的 低 边 子 结 点 。 现 在 , 根 结 点 的 两 个 子 结 
点 都 是 叶子 结 点 1, 因此 我 们 可 以 消除 根 结 点 。 也 就 是 说 , 表示 这 个 合并 操作 结果 的 最 简单 的 
BDD 就 是 叶子 1 本 身 。 E 
12.7.5， 在 指针 指向 分 析 中 使 用 BDD 

要 使 上 下 文 无 关 的 指针 指向 分 析 能 够 正确 工作 已 经 很 不 容易 了 s BDD 变量 的 排序 可 以 极 大 
地 影响 表示 的 大 小 。 要 得 到 一 个 能 够 使 得 分 析 很 快 结束 的 BDD 变量 排序 , 需要 各 种 各 样 的 考虑 ， 
也 包括 尝试 和 犯错 。 

使 得 上 下 文 相关 的 指针 指向 分 析 能 够 有 效 执行 是 一 件 更 加 困难 的 事情 , 因为 程序 中 有 指数 
量 级 的 上 下 文 。 特 别 是 , 如 果 我 们 随意 使 用 编号 来 表示 一 个 调用 图 中 的 上 下 文 , 那么 我 们 甚至 不 
能 处 理 很 小 的 Java 程序 。 按照 适 当 的 方式 对 上 下 文 进行 编号 是 很 重要 的 ; 它 可 以 使 指针 指向 分 
析 中 的 编码 变 得 非常 紧凑 。 同 一 方法 的 调用 路 径 相似 的 两 个 上 下 文 之 间 有 很 多 共同 点 ， 因此 对 
一 个 方法 的 m 个 上 下 文 连续 编码 是 比较 合适 的 。 类 似 地 , 因为 同一 个 调用 点 上 的 调用 者 -被 调 
用 者 对 之 间 具 有 很 多 相似 之 处 ,所 以 我 们 希望 对 上 下 文 进行 编码 的 方式 可 以 使 得 一 个 调用 点 上 
的 每 个 调用 者 -被 调用 者 对 之 间 的 编码 的 数值 总 是 相差 一 个 常数 。 

即使 有 了 一 个 很 合理 的 对 调用 上 下 文 编码 的 方案 , 但 高 效 地 分 析 大 型 Java 程序 仍然 困难 重 
重 。 人 们 发 现 , 主动 机 器 学 习 有 助 于 获取 较 好 的 变量 排序 , 使 得 算法 能 够 高 效 地 处 理 大 型 应 用 。 
12.7.6 12.7 节 的 练习 

练习 12. 7. 1: 使 用 例子 12. 28 中 的 符号 编码 方式 , 生成 一 个 BDD 来 表示 由 元 组 (b, b), Ce, 
a) 和 (5b, a) 组 成 的 关系 。 你 可 以 用 任意 方式 对 布尔 变量 进行 排序 , 以 获取 最 简洁 的 BDD, 

| 练习 12.7.2: 如 果 用 最 简洁 的 BDD 来 表示 个 变量 上 的 异 或 函数 , 那么 这 个 BDD 中 有 多 
少 个 结 点 ? 把 它 表 示 成 为 一 个 关于 元 的 函数 。m 个 变量 上 的 异 或 函数 是 说 如 果 这 个 变量 中 有 奇 
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数 个 变量 为 真 , 那么 这 个 函数 就 为 真 ; 如 果 有 偶数 个 变量 为 真 , 那么 函数 值 为 假 。 
练习 12. 7. 3: 修改 算法 12.29, 使 之 能 够 生成 两 个 BDD 的 交集 ( 即 逻 辑 AND) 。 


练习 12. 7.4: 找 出 在 表示 关系 的 排序 BDD 之 上 的 进行 下 列 关 系 运 算 的 算法 : 


1) 通过 投影 消除 某 些 布尔 变量 。 也 就 是 说 , 运算 得 到 的 BDD 所 表示 的 函数 如 下 : 给 定 一 个 
被 保留 变量 的 真 假 赋 值 a, 如 果 存 在 被 消除 变量 的 任何 一 个 真 假 赋 值 , 它 和 一 起 使 得 原 函 数 取 
FU, 那么 结果 函数 的 取 值 也 是 真 。 

2) 把 两 个 关系 + Als 连接 起 来 ,只 要 一 个 来 自 r 的 元 组 和 一 个 来 自 s 的 元 组 在 r A s 的 共同 
属性 上 具有 相同 的 值 , 这 两 个 元 组 就 组 合 起 来 成 为 新 关系 的 一 个 元 组 。 实 际 上 , 只 需要 考虑 下 面 
的 情况 就 足够 了 : 这 两 个 关系 都 只 有 两 个 分 量 , 且 它 们 有 一 个 公共 分 量 。 也 就 是 说 , 这 两 个 关系 


是 r(4， 


12.8 


B) 和 s(B, C)。 
第 12 章 总 结 


过 程 间 分 析 : 对 跨越 过 程 边界 的 信息 进行 跟踪 的 数据 流 分 析 称 为 过 程 间 分 析 。 很 多 分 析 
技术 ,比如 指针 指向 分 析 ，, 只 有 当 它 是 过 程 间 分 析 的 时 候 才 可 以 完成 有 意义 的 分 析 工 作 。 
调用 点 : 程序 中 调用 其 他 过 程 的 程序 点 称 为 调用 点 。 在 一 个 调用 点 上 被 调用 的 过 程 可 能 
是 显然 的 。 但 是 , 如 果 这 个 调用 是 通过 指针 间接 进行 的 , 或 者 它 调用 的 是 具有 多 个 实现 
的 虚 方 法 , 那么 被 调用 的 过 程 也 可 能 是 不 明确 的 。 

调用 图 : 一 个 程序 的 调用 图 是 一 个 二 分 图 , 图 的 结 点 分 为 对 应 于 调用 点 的 结 点 和 对 应 于 
过 程 的 结 点 。 如 果 一 个 过 程 在 一 个 调用 点 上 被 调用 , 那么 就 有 一 条 从 这 个 调用 点 结 点 到 
这 个 过 程 结 点 的 边 。 

AK: 只 要 一 个 程序 中 没有 递归 , 原则 上 我 们 可 以 把 所 有 的 过 程 调用 替换 为 过 程 代码 的 
拷贝 ,并 对 得 到 的 程序 使 用 过 程 内 分 析 技 术 。 从 效果 上 看 , 这 个 分 析 是 过 程 间 分 析 。 
控制 流 相关 性 和 上 下 文 相 关 性 : 如 果 一 个 数据 流 分 析 得 到 的 事实 和 程序 中 的 位 置 相关 ， 
那么 它 就 是 控制 流 相关 的 。 如 果 一 个 数据 流 分 析 得 到 的 事实 和 过 程 调用 的 历史 相关 , 那 
么 它 就 是 上 下 文 相关 的 。 一 个 数据 流 分 析 可 以 是 控制 流 相 关 的 、 上 下 文 相关 的 、 两 者 都 
相关 或 者 都 不 相关 。 

基于 克隆 的 上 下 文 相关 分 析 : 从 原则 上 讲 , 一 旦 我 们 建立 了 过 程 调 用 的 不 同上 下 文 , 就 可 
以 想象 对 于 每 个 上 下 文 都 有 一 个 该 过 程 的 克隆 。 按 照 这 种 方法 ,一 个 上 下 文 无 关 分 析 技 
术 可 以 用 来 进行 上 下 文 相关 分 析 。 

基于 摘要 的 上 下 文 相关 分 析 : 另 一 个 过 程 间 分 析 的 方法 , 扩展 原来 为 过 程 内 分 析 而 设计 
的 基于 区 域 的 分 析 技 术 。 每 个 过 程 有 一 个 传递 函数 , 并且 在 每 一 个 调用 该 过 程 的 地 方 它 
都 被 当 作 一 个 区 域 处 理 。 

过 程 间 分 析 技 术 的 应 用 : 需要 过 程 间 分 析 技 术 的 重要 应 用 之 一 是 检测 软件 的 安全 漏洞 。 
这 些 漏洞 的 常见 特性 是 一 个 过 程 从 某 个 不 可 信 的 输入 源 读 取 数据 , 而 另 一 个 过 程 以 可 能 
被 利用 的 方式 使 用 这 个 输入 。 : 

Datalog: Datalog 语言 是 if-then 规则 的 简单 表示 方式 , 它 可 以 用 于 在 高 层次 上 描述 数据 流 
分 析 。 一 组 Datalog 规则 (或 者 说 Datalog 程序 ) 可 以 使 用 多 个 标准 算法 中 的 任意 一 个 算法 
进行 求 值 。 

Datalog 规则 : 一 个 Datalog 规则 由 一 个 规则 体 ( 前 提 ) 和 一 个 规则 头 ( 结 果 ) 组 成 。 规 则 体 
是 一 个 或 多 个 原子 , 而 规则 头 则 是 一 个 原子 。 原 子 就 是 作用 于 一 组 参数 的 断言 , 这些 参 
数 的 值 可 以 是 变量 或 常量 。 规 则 体 的 多 个 原子 通过 逻辑 AND 连接 , 而 规则 体 中 的 原子 可 
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能 是 断言 的 否定 形式 。 
e IDB 和 EDB 断言 :一 个 Datalog 程序 中 的 EDB 断言 的 真 值 事实 在 事先 给 出 。 在 一 个 数据 
流 分 析 中 , 这 些 断 言 对 应 于 那些 可 以 从 被 分 析 代码 中 获取 的 事实 。IDB 断言 本 身 是 通过 
规则 定义 的 。 在 一 个 数据 流 分 析 中 , 它们 对 应 于 我 们 想 从 被 分 析 代码 中 抽取 的 信息 。 
Datalog 程序 的 求 值 : 我 们 应 用 规则 的 方法 是 把 规则 中 的 变量 替换 为 一 些 能 够 使 该 规则 体 
取 真 值 的 常量 ， 当 我 们 做 了 这 样 的 蔡 换 后 ， 就 可 以 推断 将 规则 头 中 的 变量 进行 相同 替换 
后 得 到 的 断言 也 为 真 。 这 个 操作 不 断 重复 , 直到 不 能 推导 出 更 多 的 事实 为 止 。 
Datalog 程序 的 增 量 求 值 : 通过 增 量 求 值 的 方法 可 以 改进 Datalog 程序 的 求 值 效率 。 我 们 将 
进行 多 轮 求 值 。 在 每 一 轮 中 , 我 们 只 考虑 如 下 的 变量 到 常量 的 蔡 换 方法 : 它 使 得 规则 体 
中 至 少 有 一 个 原子 是 刚刚 在 上 一 轮 中 被 发 现 的 事实 。 
Java 指针 分 析 : 我 们 可 以 用 一 个 框架 对 Java 中 的 指针 分 析 建 模 。 在 这 个 框架 中 , 有 一 些 
指向 堆 对 象 的 引用 变量 ,而 这 些 堆 对 象 中 又 有 一 些 字段 可 以 指向 其 他 堆 对 象 。 可 以 用 一 
个 Datalog 程序 写 出 一 个 上 下 文 无 关 的 指针 分 析 方法 。 这 个 分 析 可 以 推导 出 两 种 事实 : 一 
个 变量 可 能 指向 一 个 堆 对 象 ， 以 及 一 个 堆 对 象 的 字段 可 能 指向 另 一 个 堆 对 象 。 
使 用 类 型 信息 改进 指针 分 析 : 引用 变量 所 指向 的 堆 对 象 的 类 型 要 么 和 变量 类 型 相同 , 要么 是 变 
量 类 型 的 子 类 型 。 如 果 我 们 能 够 利用 这 个 事实 , 我 们 就 可 以 得 到 更 加 精确 的 指针 分 析 结果 。 
过 程 间 指针 分 析 : 为 了 进行 过 程 间 分 析 , 我 们 必须 增加 一 些 规则 来 反映 参数 是 如 何 传递 的 , 返 
回 值 是 如 何 被 赋 给 变量 的 。 这 些 规 则 实质 上 和 把 一 个 引用 变量 复制 到 另 一 个 引用 变量 的 规则 
相同 。 
寻找 调用 图 : 因为 Java 具有 虚 方 法 , 过程 间 分 析 要 求 我 们 首先 界定 有 哪些 过 程 可 能 在 一 
个 给 定 调用 点 上 被 调用 。 找 出 哪里 可 以 调用 哪些 程序 的 限制 的 基本 方法 是 分 析 对 象 的 类 
型 ,并 利用 下 面 的 事实 : 一 个 虚 方 法 调用 所 指向 的 实际 方法 必须 属于 适当 的 类 。 
上 下 文 相关 分 析 : 当 过 程 具有 递归 特性 时 , 我 们 必须 把 调用 串 中 所 包含 的 信息 浓缩 到 有 
限 多 个 上 下 文中 。 做 这 件 事 的 有 效 方法 之 一 是 从 调用 串 中 删除 某 个 过 程 调用 与 之 相互 弟 
归 调 用 的 另 一 个 过 程 (可 能 是 调用 者 本 身 ) 的 调用 点 。 使 用 这 样 的 表示 方式 , 我 们 可 以 修 
改过 程 内 指针 分 析 的 规则 , 使 断言 中 包含 上 下 文 信息 。 这 个 方法 模拟 了 基于 克隆 的 分 析 。 
二 分 决策 图 : BDD 是 一 种 使 用 带 根 的 DAG 表示 布尔 函数 的 简洁 方法 。 内 部 结 点 对 应 于 布 
尔 变量 , 并 且 有 两 个 子 结 点 , 即 低 子 结 点 (表示 0 值 ) 和 高 子 结 点 (表示 1 值 )。 图 中 有 标 
号 分 别 为 0 和 1 的 两 个 叶子 结 点 。 一 个 真 假 赋 值 使 得 被 表示 函数 取 真 值 当 且 仅 当 从 图 的 
根 结 点 有 一 条 如 下 的 路 径 到 达 叶 子 结 点 1。 这 条 路 径 从 根 结 点 开始 ; 如 果 一 个 结 点 上 的 
变量 取 值 为 0, 那么 我 们 就 走 到 低 子 结 点 , 否则 走 到 高 子 结 点 。 
BDD 和 关系 : 一 个 BDD 可 以 作为 Datalog 程序 中 的 断言 的 简洁 表示 方法 。 常 量 被 编码 为 
一 组 布尔 变量 的 真 假 赋值 ,， BDD 表示 的 函数 为 真 当 且 仅 当 它 的 布尔 变量 表示 了 使 这 个 断 
言 取 真 值 的 事实 。 
使 用 BDD 实现 数据 流 分 析 : 任何 可 以 被 表示 为 Datalog 规则 的 数据 流 分 析 都 可 以 使 用 
BDD 上 的 操作 来 实现 。 这 些 BDD 表示 了 规则 所 涉及 的 断言 。 这 个 表示 方法 经 常会 得 到 
一 个 比 其 他 已 知 方法 更 加 高 效 的 实现 。 
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附录 A ”一 个 完整 的 编译 器 前 站 


这 个 附录 给 出 了 一 个 完整 的 编译 器 前 端 , 它 是 基于 2.5 节 至 2.8 节 中 非 正 式 描 述 的 简单 编译 
器 编写 的 。 和 第 2 章 的 主要 不 同 之 处 在 于 , 这 个 前 端 像 6.6 节 中 描述 的 那样 为 布尔 表达 式 生成 跳 
转 代码 。 我 们 首先 给 出 源 语言 的 语法 。 描述 这 个 语法 所 用 的 文法 需要 进行 调整 ,以 适应 自 顶 向 
下 的 语法 分 析 技 术 。 

这 个 翻译 器 的 Java 代码 由 五 个 包 组 成 :main、lexer、symbol、 parser 和 inter。 包 in- 
ter 中 包含 的 类 处 理 用 抽象 语法 表示 的 语言 结构 。 因为 语法 分 析 器 的 代码 和 其 他 各 个 包 交 互 ， 
所 以 它 将 在 最 后 描述 。 每 个 包 存 放 在 一 个 独立 的 目录 中 ， 每 个 类 都 有 一 个 单独 的 文件 。 

作为 语法 分 析 器 的 输入 时 , 源 程序 就 是 一 个 由 词法 单元 组 成 的 流 ， 因此 面向 对 象 特性 和 语法 
分 析 器 的 代码 之 间 没 有 什么 关系 。 当 由 语法 分 析 器 输出 时 ， 源 程 序 就 是 一 棵 抽象 语法 树 ， 树 中 的 
结构 或 结 点 被 实现 为 对 象 。 这 些 对 象 负责 处 理 下 列 工作 :构造 一 个 抽象 语法 树 结 点 、 类 型 检查 、 
生成 三 地 址 中 间 代 码 ( 见 包 inter)。 


A. 1 源 语言 


这 个 语言 的 一 个 程序 由 一 个 块 组 成 , 该 块 中 包含 可 选 的 声明 和 语句 。 语 法 符号 basic 表示 
基本 类 型 。 


program — block 

block -+ { decls stmts } 

decls — decis decl | € 

decl = . type id ; 
type — type [num] | basic 
stmts — stmts stmt | € 


把 赋值 当 作 一 个 语句 (而 不 是 表达 式 中 的 运算 符 ) 可 以 简化 翻译 工作 。 





面向 对 象 与 面向 步骤 

在 一 个 面向 对 象 方法 中 , 一 个 构造 的 所 有 代码 都 集中 在 这 个 与 构造 对 应 的 类 中 。 但 是 在 
面向 步骤 的 方法 中 , 这 个 方法 中 的 代码 是 按照 步骤 进行 组 织 的 ， 因此 一 个 类 型 检查 过 程 中 对 
每 个 构造 都 有 一 个 case 分 支 , 上 且 一 个 代码 生成 过 程 对 每 个 构造 也 都 有 一 个 case 分 支 等 等 。 

对 这 两 者 进行 衡量 , 可 知 使 用 面向 对 象 方 法 会 使 得 改变 或 增加 一 个 构造 ( 比如 for 语句 ) 
变 得 较 容易 ; 而 使 用 面向 步 又 的 方法 会 使 得 改变 或 增加 一 个 步骤 (比如 类 型 检查 ) 变 得 比较 容 
易 。 使 用 对 象 来 实现 时 , 增加 一 个 新 的 构造 可 以 通过 写 一 个 自 包含 的 类 来 实现 ; 但 是 如 果 要 
改变 一 个 步骤 ,比如 插入 自动 类 型 转换 的 代码 ,就 需要 改变 所 有 受 影响 的 类 。 使 用 面向 步骤 
的 方式 时 ,增加 一 个 新 构造 可 能 会 引起 各 个 步骤 中 的 多 个 过 程 的 改变 。 











stmt — loc= bool; 

| if ( bool) stmt 

| if ( bool) stmt else stmt 
| while ( bool ) stmt 

| do stmt while ( bool ) ; 
| break ; 

| block 

> 


loc loc [ bool] | id 
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表达 式 的 产生 式 处 理 了 运算 符 的 结合 性 和 优先 级 。 它们 对 每 个 优先 级 级 别 都 使 用 了 一 个 非 
终结 符号 , 而 非 终 结 符号 factor 用 来 表示 括号 中 的 表达 式 、 标 识 符 、 数 组 引用 和 常量 。 


bool — bool || join | join 
join —- join && equality | equality 
equality —> equality == rel | equality != rel | rel 
rel — expr < expr | expr <= expr | expr >= expr | 
expr > expr | expr 
expr —> expr+ term | expr- term | term 
term — term» unary | term / unary | unary 
unary —> ! unary | - unary | factor 
factor — (bool) | loc | num | real | true | false 
A.2 Main 


程序 的 执行 从 类 Main 的 方法 main 开始 。 方 法 main 创建 了 一 个 词法 分 析 器 和 一 个 语法 分 
析 器 , 然后 调用 语法 分 析 器 中 的 方法 program, 


1) package main; // 文件 Main.java 

2) import java.io.*; import lexer.*; import parser.*; 

3) public class Main { 

4) public static void main(String[] args) throws IOException { 


5) Lexer lex = new Lexer(); 

6) Parser parse = new Parser(lex); 
7) parse.program() ; 

8) System.out.write(’\n’); 

9y. 3} 

10) } 


A.3 词法 分 析 器 


包 lexer 是 2.6.5 节 中 的 词法 分 析 器 的 代码 的 扩展 。 类 Tag 定义 了 各 个 词法 单元 对 应 的 
常量 : 


) package lexer; // 文件 Tag.java 
2) public class Tag { 
3) public final static int 


4) AND = 256, BASIC = 257, BREAK = 258, DO = 259, ELSE = 260, 
5) EQ = 261, FALSE = 262, GE = 963, ID —="264, IF = 265, 
6) INDEX = 266, LE = 267, MINUS = 268, NE = 269, NUM = 270, 
7) OR = 271, REAL = 272, TEMP = 273, TRUE = 274, WHILE = 275; 
8) } 


其 中 的 三 个 常量 INDEX, MINUS 和 TEMP 不 是 词法 单元 ,它们 将 在 抽象 语法 树 中 使 用 。 
类 Token 和 Num 和 2. 6.5 节 的 相同 , 但 是 增加 了 方法 toString: 


1) package lexer; // 文件 Token.java 

2) public class Token { 

3) públic final int tag; 

4) public Token(int t) { tag = t; } 

5) public String toString() {return "" + (char)tag;} 
6) } 


1) package lexer; // 文 件 Num.java 

2) public class Num extends Token { 

3) public final int value; 

4) public Num(int v) { super(Tag.NUM); value = v; } 
5) public String toString() { return "" + value; } 
6) } 


类 Word 用 于 管理 保留 字 、 标 识 符 和 像 && 这 样 的 复合 词法 单元 的 词素 。 它 也 可 以 用 来 管理 在 中 
间 代 码 中 运算 符 的 书写 形式 ; 比如 单 目 减 号 。 例 如 , 源 文本 中 的 -2 的 中 间 形 式 是 minus 2。 
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1) package lexer; // 文件 Word.java 

2) public class Word extends Token { 

3) public String lexeme = ""; 

4) public Word(String s, int tag) { super(tag); lexeme = s; } 
5) public String toString() { return lexeme; } 

6) public static final Word 

new Word( "&&", Tag-AND ), or 


= new Word( "||", Tag.OR ), 
8) eq = new Word( "==", Tag.EQ ), ne 


new Word( "!=", Tag.NE ), 


nou ow 


9) le new Word( "<=", Tag.LE ), ge = new Word( ">=", Tag.GE ), 
10) minus = new Word( "minus", Tag.MINUS ), 
11) True = new Word( "true", Tag.TRUE ), 
12) False = new Word( "false", Tag.FALSE ), 
13) temp = new Word( "t", Tag. TEMP ); 
14) } 
类 Real 用 于 处 理 浮 点 数 : 
1) package lexer; // 文件 Real.java 


2) public class Real extends Token { 

3) public final float value; 

4) public Real(float v) { super(Tag.REAL); value = v; } 

5) public String toString() { return "" + value; } 

6) } 
如 我 们 在 2. 6.5 节 中 讨论 的 , 类 Lexer 的 主 方法 ， 即 函数 scan, 识别 数字 、 标 识 符 和 保留 字 。 

类 Lexer 中 的 第 9 ~ 13 行 保留 了 选 定 的 关键 字 。 第 14 ~ 16 行 保留 了 在 其 他 地 方 定义 的 对 象 
的 词素 。 对 象 Word.True 和 Word. False 在 类 Word 中 定义 。 对 应 于 基本 类 型 int、char、 
bool 和 float 的 对 象 在 类 Type 中 定义 。 类 Type Æ Word 的 一 个 子 类 。 类 Type 来 自 包 sym- 
bols» i 

1) package lexer; // 文件 Lexer.java 

2) import java.io.*; import java.util.*; import symbols.*; 

3) public class Lexer { 

4) public static int line = 1; 

5) char peek =” ’; 

6) Hashtable words = new Hashtable(); 


1) void reserve(Word w) { words.put(w.lexeme, w); } 
8) public Lexer() { 


9) reserve( new Word("if", Tag. IF) F; 

10) reserve( new Word("else", Tag.ELSE) ); 

11) reserve( new Word("while", Tag.WHILE) ); 

12) reserve( new Word("do", Tag .D0) UR 

13) reserve( new Word("break", Tag.BREAK) ); 

14) reserve( Word.True ); reserve( Word.False ); 
15) reserve( Type.Int ); reserve( Type.Char ); 
16) reserve( Type.Bool ); reserve( Type.Float ); 
17) $ 


函数 readch( ) (48 18 行 ) 用 于 把 下 一 个 输入 字符 读 到 变量 peek Ho AF readch 被 复 用 或 重 
载 , (第 19~24 行 ), 以 便 帮助 识别 复合 的 词法 单元 。 比 如 , 一 看 到 输入 字符 <, 调用 readch 
("=") 就 会 把 下 一 个 字符 读 和 人 peek, 并 检查 它 是 否 为 =。 


18) void readch() throws I0Exception { peek = (char)System.in.read(); } 
19) boolean readch(char c) throws I0Exception { 


20) readch() ; 

21) if( peek != c ) return false; 
22) peek =’ ’; 

23) return true; 

24) i) 


函数 scan 一 开始 首先 略 过 所 有 的 空白 字符 (第 26 ~ 30 行 ) 。 它 首先 试图 识别 像 < = 这 样 的 复合 
词法 单元 (第 31 ~34 行 ) 和 像 365 及 3. 14 这 样 的 数字 (第 45 ~ 58 行 )。 如 果 不 成 功 , 它 就 试图 读 
入 一 个 字符 串 ( 第 59 ~70 行 )。 
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25) public Token scan() throws I0Exception { 
26) forl ; ; readch() ) { 
27) if( peek == ’ ? || peek == ’\t’ ) continue; 
28) else if( peek == ’\n’") line = line s+ 1; 
29) else break; 
30) J 
31) switch( peek ) { 
32) case ’&?: 
33) if( readch(’&’) ) return Word.and; else return new Token(’&’); 
34) case ’|’: : 
35) if( readch(’|’) ) return Word.or; else return new Token(’|’); 
36) case ’=’: 
37) if( readch(’=’) ) return Word.eq; else return new Token(’=’); 
38) case 71): 
39) if( readch(’=’) ) return Word.ne; else return new Token(’!’); 
40) case ’<?: 
41) if( readch(’=’) ) return Word.le; else return new Token(’<’); 
42) case ’>?: 
43) if( readch(’=’) ) return Word.ge; else return new Token(’>’); 
44) } 
45) if( Character.isDigit(peek) ) { 
46) int v = 0; 
47) do { 
48) v = 10*v + Character.digit(peek, 10); readch(); 
49) } while( Character.isDigit(peek) ); 
50) if( peek != ’.’ ) return new Num(v); 
51) float°x = yi float’d’="10: 
52) for; ;) £ 
53) readch() ; 
54) if( ! Character.isDigit(peek) ) break; 
55) x = x + Character.digit(peek, 10) / d; d = d*10; 
56) } 
57) return new Real(x); 
58) } 
59) if( Character.isLetter(peek) ) { 
60) StringBuffer b = new StringBuffer(); 
61) do { 
62) b.append(peek); readch(); 
63) } while( Character.isLetterOrDigit (peek) ); 
64) String s = b.toString(); 
65) Word w = (Word)words.get(s); 
66) if( w != null ) return w; 
67) w = new Word(s, Tag.ID); 
68) words.put(s, w); 
69) return w; 
70) } 

最 后 , peek 中 的 任意 字符 都 被 作为 词法 单元 返回 (第 71 ~72 fT). 
71) Token tok = new Token(peek); peek = ’; 
72) return tok; 
73) F 
74) } 


A.4 符号 表 和 类 型 


包 symbols 实现 了 符号 表 和 类 型 。 
类 Env 实质 上 和 图 2-37 中 的 代码 一 样 。 类 Lexer 把 字符 串 映 射 为 字 , 类 Env 把 字符 串 词 
法 单元 映射 为 类 IG 的 对 象 。 类 Id 和 其 他 的 对 应 于 表达 式 和 语句 的 类 一 起 都 在 包 inter 中 


HE Mo 
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1) package symbols; // 文件 Env.java 

2) import java.util.*; import lexer.*; import inter.*; 

3) public class Env { 

4) private Hashtable table; 

5) protected Env prev; 

6) public Env(Env n) { table = new Hashtable(); prev = n; } 
7) public void put(Token w, Id i) { table.put(w, i); } 

8) public Id get(Token w) { 


9) for( Env e = this; e != null; e = e.prev ) { 
10) Id found = (Id)(e.table.get(w)); 

11) if( found != null ) return found; 

12) } 

13) return null; 

in 3 

15) 了 


我 们 把 类 Type 定义 为 类 Word 的 子 类 , AAK int 这 样 的 基本 类 型 名 字 就 是 保留 字 , 将 被 
词法 分 析 器 从 词素 映射 为 适当 的 对 象 s 对 应 于 基本 类 型 的 对 象 是 Type. Int, Type. Float, 
Type. Char 和 Type.Bool( 第 7~10 行 )。 这 些 对 象 从 超 类 中 继承 了 字段 tag, 相应 的 值 被 设 
EX Tag. BASIC, 因此 语法 分 析 器 以 同样 的 方式 处 理 它们 。 


1) package symbols; // 文件 Type.java 

2) import lexer.*; 

3) public class Type extends Word { 

4) public int width = 0; //width 用 于 存储 分 配 

5) public Type(String s, int tag, int w) { super(s, tag); width = w; } 
6) public static final Type 


7) Int = new Type( "int", Tag.BASIC, 4 ), 
8) Float = new Type( "float", Tag.BASIC, 8 ), 
9) Char = new Type( "char", Tag.BASIC, 1 ), 
10) Bool = new Type( "bool", Tag.BASIC, 1 ); 


函数 numeric( Ff 11 ~ 14 47) Al max( $ 15 ~20 行 ) 可 用 于 类 型 转换 。 


11) public static boolean numeric(Type p) { 


12) if (p == Type.Char || p == Type.Int || p == Type.Float) return true; 
13) else return false; 
14) Hy 
15) public static Type max(Type pi, Type p2 ) { 
16) if ( ! numeric(p1) || ! numeric(p2) ) return null; 
17) else if ( pl == Type.Float || p2 == Type.Float ) return Type.Float; 
18) © else if (pl == Type.Int || p2 == Type.Int ) return Type.Int; 
19) else return Type.Char; 

. 20) } 
21): 7 


“在 两 个 “数字 ”类 型 之 间 人 允许 进行 类 型 转换 ,“ 数 字 ” 类 型 包括 Type.Char, Type. Int 和 
Type.Float。 当 一 个 算术 运算 符 应 用 于 两 个 数字 类 型 时 , 结果 类 型 是 这 两 个 类 型 的 “max” 值 。 

数组 是 这 个 源 语言 中 唯一 的 构造 类 型 。 在 第 7 行 中 调用 super 设置 字段 width 的 值 。 这 个 

值 在 计算 地 址 时 是 必 不 可 少 的 。 它 同时 也 把 lexeme 和 tok 设置 为 默认 值 , 这 些 值 没有 被 使 用 。 


1) package symbols; // 文件 Array.java 
2) import lexer.*; 
3) public class Array extends Type { 


4) public Type of; // 数组 的 元 素 类 型 

5) public int size = 1; // 元 素 个 数 

6) public Array(int sz, Type p) { 

n super("[]", Tag.INDEX, sz*p.width); size = sz; of = p; 
8 } 


9) public String toString() { return "[" + size + "] " + of .toString(); } 
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A.5 表达 式 的 中 间 代 码 


包 inter 包含 了 Node 的 类 层次 结构 。Node 有 两 个 子 类 :对 应 于 表达 式 结 点 的 Expr 和 对 
应 于 语句 结 点 的 Stmt。 本 节 介 绍 Expr 和 它 的 子 类 。Expr 的 某 些 方法 处 理 布尔 表达 式 和 跳 转 
代码 , 这 些 方法 和 Expr 的 其 他 子 类 将 在 A.6 节 中 讨论 。 

抽象 语法 树 中 的 结 点 被 实现 为 类 Node 的 对 象 。 为 了 报告 错误 , 字段 lexline (文件 
Node. java 的 第 4 行 ) 保 存 了 本 结 点 对 应 的 构造 在 源 程序 中 的 行 号 。 第 7~ 10 行 用 来 生成 三 地 
址 代码 。 


1) package inter; // 文件 Node.java 

2) import lexer.*; 

3) public class Node { 

4) int lexline = 0; 

5) Node() { lexline = Lexer.line; } 

6) void error(String s) { throw new Error("near line "+lexlinet+": "+s); } 
7) static int labels = 0; 

8) public int newlabel() { return ++labels; } 

9) public void emitlabel(int i) { System.out.print("L" + i + shor en Dh 
10) public void emit (String s) { System.out.printin("\t" + sy 
LD} 


表达 式 构造 被 实现 为 Expr 的 子 类 。 类 Expr 包含 字段 op 和 type( 文 件 Expr. java 的 第 
4 ~5 行 ), 分 别 表 示 了 一 个 结 点 上 的 运算 符 和 类 型 。 


1) package inter; // 文件 Ezpr.java 

2) import lexer.*; import Symbols .*; 

3) public class Expr extends Node { 

4) public Token op; 

5) public Type type; 

6) Expr(Token tok, Type p) { op = tok; type = P; } 


方法 gen( 第 7 行 ) 返 回 了 一 个 项 ， 该 项 可 以 成 为 一 个 三 地 址 指令 的 右 部 。 给 定 一 个 表达 
式 E=E +E, 方法 gen 返回 一 个 项 xi +x, 其 中 Xi All x2 分 别 是 存放 E; All Ez 值 的 地 址 。 如 果 
这 个 对 象 是 一 个 地 址 , 就 可 以 返回 this fH, Expr 的 子 类 通常 会 重新 实现 gen。 

方法 reduce( 第 8 行 ) 把 一 个 表达 式 计算 (或 者 说 “ 归 约 ” ) 成 为 一 个 单一 的 地 址 。 也 就 是 说 ， 
它 返回 一 个 常量 、 一 个 标识 符 , 或 者 一 个 临时 名 字 。 给 定 一 个 表达 式 , 方法 reduce 返回 一 个 
存放 互 的 值 的 临时 变量 1+。 如 果 这 个 对 象 是 一 个 地 址 ， 那么 this 仍然 是 正确 的 返回 值 。 

我 们 把 对 方法 jumping 和 emitjumps( 第 9~18 行 ) 的 讨论 推迟 到 A.6 节 中 进行 , 它们 为 . 
布尔 表达 式 生成 跳 转 代码 。 


public Expr gen() { return this; } 

8) public Expr reduce() { return this; } 

9) public void jumping(int t, int f) { emitjumps(toString(), t, £); } 
10) public void emitjumps(String test, int t, int f) { 


11) itii oke f t= 0y 4 

12) emit("if "+ test + " goto L" + t); 

13) emit("goto L" + f); 

14) 

15) else if( t != 0 ) emit("if " + test + " goto L" + t): 

16) else if( f != 0 ) emit("iffalse " + test + " goto Ds 
a : else ; // 不 生成 指令 ， 因 为 t 和 了 都 直接 穿越 

19) public String toString() { return op.toString(); } 

20) } 


因为 一 个 标识 符 就 是 一 个 地 址 , 类 Id 从 类 Expr 中 继承 了 gen 和 reduce 的 默认 实现 。 
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1) package inter; // 文件 Td.java 

2) import lexer.*; import symbols.*; 

3) public class Id extends Expr { 

4) public int offset; // 相对 地 址 

5) public Id(Word id, Type p, int b) { super(id, p); offset = b; } 
6) } 7 


对 应 于 一 个 标识 符 的 类 Id 的 结 点 是 一 个 叶子 结 点 。 函 数 调 用 super( id, p) (文件 Id. java 的 第 
5 行 ) 把 ia Al 分 别 保存 在 继承 得 到 的 字段 op 和 type 中 。 字段 offset( 第 4 行 ) 保 存 了 这 个 
标识 符 的 相对 地 址 。 

类 op 提供 了 reduce 的 一 个 实现 (文件 Op. java 的 第 5 ~ 10 行 ) 。 这 个 类 的 子 类 包括 :表示 
算术 运算 符 的 子 类 Arith, 表示 单 目 运算 符 的 子 类 Unary 和 表示 数组 访问 的 子 类 access, X 
些 子 类 都 继承 了 这 个 实现 。 在 每 种 情况 下 , reduce 调用 gen 来 生成 一 个 项 , 生成 一 个 指令 把 这 
个 项 赋值 给 一 个 新 的 临时 名 字 , 并 返回 这 个 临时 名 字 。 


1) package inter; // 文件 Op.java 

2) import lexer.*; import symbols.*; 

3) public class Op extends Expr { 

4) public Op(Token tok, Type p) { super(tok, p); } 
5) public Expr reduce() { 


6) Expr x = gen(); 

7) Temp t = new Temp(type); 

8) emit( t.toString() + " =" + x.toString() ); 
9) return t; 

10) } 

11) } 


类 arith 实现 了 双 目 运算 符 , 比如 + 和 *。 构造 函数 Arith 首先 调用 super(tok,null) ($ 6 
行 ), 其 中 tok 是 一 个 表示 该 运算 符 的 词法 单元 , null 是 类 型 的 占 位 符 。 相 应 的 类 型 在 第 7 行使 用 函 
Be Type. max 来 确定 , 这 个 函数 检查 两 个 运算 分 量 是 否 可 以 被 类 型 强制 为 一 个 常见 的 数字 类 型 ; 
Type. max 的 代码 在 A.4 节 中 给 出 。 如 果 它 们 能 够 进行 自动 类 型 转换 , type 就 被 设置 为 结果 类 型 ; T 
则 就 报告 一 个 类 型 错误 (第 8 行 )。 这 个 简单 编译 器 检查 类 型 , 但 是 它 并 不 插入 类 型 转换 代码 。 


1) package inter; // 文件 Arith.java 
2) import lexer.*; import symbols.*; 

3) public class Arith extends Op { 

4) public Expr expri, expr2; 

5) public Arith(Token tok, Expr x1, Expr x2) { 


6) super(tok, null); expri = x1; expr2 = x2; 

7) type = Type.max(expri.type, expr2.type) ; 

8) if (type == null ) error("type error"); 

9) 

10) public Expr gen() { 

11) return new Arith(op, expri.reduce(), expr2.reduce()); 
12) j 

13) public String toString() { 

14) return expri.toString()+" "top.toString()+" "“+texpr2.toString() ; 
15) } 

16) } 


方法 gen 把 表达 式 的 子 表 达 式 归 约 为 地 址 , 并 将 表达 式 的 运算 符 作用 于 这 些 地 址 (文件 
Arith. java 的 第 11 行 ), 从 而 构造 出 了 一 个 三 地 址 指令 的 右 部 。 比 如 , 假设 gen 在 a +b*c 的 根 
部 被 调用 。 其 中 对 reduce 的 调用 返回 a 作为 子 表达 式 a 的 地 址 , 并 返回 t EX b» c 的 地 址 。 
同时 ,reduce 还 生成 指令 上 =b*c。 方法 gen 返回 了 一 个 新 的 Arith 结 点 , 其 中 的 运算 符 是 
* ,而 运算 分 量 是 地 址 a Al tO 


日 为 了 报告 错误 ,在 构造 一 个 结 点 时 ,类 Node 中 的 字段 lexline 记录 了 当前 的 文本 行 号 。 我 们 把 在 中 间 代 码 生成 
过 程 中 构造 新 的 结 点 时 跟踪 行 号 的 任务 留 给 读者 。 
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值得 注意 的 是 ， 和 所 有 其 他 表达 式 一 样 , 临时 名 字 也 有 类 型 。 因 此 , 构造 函数 Temp 被 调用 
时 有 一 个 类 型 参数 (文件 Temp. java 的 第 6 行 ) .9 


1) package inter; // 文件 Temp.java 

2) import lexer.*; import symbols.*; 

3) public class Temp extends Expr { 

4) static int count = 0; 

5) int number = 0; 

6) public Temp(Type p) { super(Word.temp, p); number = ++count; } 
7) public String toString() { return "t" + number; } 


8) } 
类 Unary 和 类 Arith 对 应 , 但 是 处 理 的 是 单 目 运算 符 ; 
1) package inter; // 文件 Unary.java 


2) import lexer.*; import symbols.*; 

3) public class Unary extends Op { 

4) public Expr expr; 

5) public Unary(Token tok, Expr x) { // 处 理 单 目 减法 ， 对 ! 的 处 理 见 Not 


6) super(tok, null); expr = x; 

7) type = Type.max(Type.Int, expr.type) ; 

8) if (type == null ) error("type error"); 

9) 

10 public Expr gen() { return new Unary(op, expr.reduce()); } 


) 
11) public String toString() { return op.toString()+" "+expr.toString(); } 
)} 


A.6 布尔 表达 式 的 跳 转 代码 


布尔 表达 式 B 的 跳 转 代码 由 方法 jumping 生成 。 这 个 方法 的 参数 是 两 个 标号 七 和 上, 它们 
分 别称 为 表达 式 B 的 true tH OA false HO, WE B MBAR, 代码 中 就 包含 一 个 目标 为 t 的 跳 
转 指 令 ; 如 果 B 的 值 为 假 , 就 有 一 个 目标 为 £ 的 指令 。 按 照 惯例 , 特殊 标号 0 表示 控制 流 从 B F 
越 , BGA B 的 代码 之 后 的 下 一 个 指令 。 

我 们 从 类 Constant 开始 。 第 4 行 上 的 构造 函数 Constant 的 参数 是 一 个 词法 单元 tok 和 
一 个 类 型 p。 它 在 抽象 语法 树 中 构造 出 一 个 标号 为 tok、 类 型 为 p 的 叶子 结 点 。 为 方便 起 见 , 构 
造 函 数 Constant 被 重 载 (第 5 行 ), 重 载 后 的 构造 函数 可 以 根据 一 个 整数 创建 一 个 常量 对 象 。 


1) package inter; // 文 件 Constant.java 

2) import lexer.*; import symbols.*; 

3) public class Constant extends Expr { 

4) public Constant(Token tok, Type p) { super(tok, p); } 
5) public Constant(int i) { super(new Num(i), Type.Int); } 
6) public static final Constant 


7) True = new Constant(Word.True, Type.Bool), 

8) False = new Constant(Word.False, Type.Bool); 

9) public void jumping(int t, int f) { 

10) if ( this == True && t != 0 ) emit("goto L" + t); 

T1) else if ( this == False && f != 0) emit("goto L" + f); 
12) 了 

13) } 


方法 jumping (SCF Constant. java 的 第 9 ~12 行 ) 有 两 个 参数 : 标号 为 t 和 f。 如 果 这 个 常量 是 
静态 对 象 rrue( 在 第 7 行 中 定义 ), t 不 是 特殊 标号 0, 那么 就 会 生成 一 个 目标 为 t 的 跳 转 指令 。 否 
WW, 如 果 这 是 对 象 False( 在 第 8 行 中 定义 ) 且 £ EF, 那么 就 会 生成 一 个 目标 为 £ 的 跳 转 指令 。 





O 另 一 种 可 行 的 方法 是 让 这 个 构造 函数 以 一 个 表达 式 结 点 作为 参数 ,这 样 它 就 可 以 复制 这 个 表达 式 结 点 的 类 型 和 文 
本 位 置 。 
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类 Logical 为 类 Or, And 和 Not 提供 了 一 些 常 见 功 能 字段 expr1 Al expr2 ($ 4 47) Xt 
应 于 一 个 逻辑 运算 符 的 运算 分 量 ( 虽然 类 Not 实现 了 一 个 单 目 运算 符 , 为 方便 起 见 , 我 们 还 是 把 
它 当 作 Logical 的 子 类 )。 构 造 函 数 Logical(tok,a,b)( 第 5~10 行 ) 构 造 出 了 一 个 语法 树 的 
结 点 , 其 运算 符 为 tok, 而 运算 分 量 为 a 和 了 bb。 在 完成 这 些 工作 时 , 它 调用 函数 check 来 保证 a 
Al 都 是 布尔 类 型 。 方 法 gen 将 会 在 本 节 的 最 后 讨论 。 


1) package inter; // 文件 Logical.java 
2) import lexer.*; import symbols.*; 

3) public class Logical extends Expr { 

4) public Expr expri, expr2; 

5) Logical(Token tok, Expr x1, Expr x2) { 


6) super(tok, null); // 开始 时 类 型 设置 为 空 
7) expri = x1; expr2 = x2; 

8) type = check(expri.type, expr2.type); 

9) if (type == null ) error("type error"); 

TO a 

11) public Type check(Type p1, Type p2) { 

12) if ( pl == Type.Bool && p2 == Type.Bool ) return Type.Bool; 
13) else return null; 

4} 

15) public Expr gen() { 

16) int f = newlabel(); int a = newlabel(); 

17) Temp temp = new Temp(type) ; 

18) this. jumping(0,f); 

19) emit(temp.toString() + " = true"); 

20) emit("goto L" + a); 

21) emitlabel(f); emit(temp.toString() + " = false"); 

22) emitlabel (a) ; 

23) return temp; 

24) | 证 

25) public String toString() { 

26) return expri.toString()+" "+op.toString()+" "“+expr2.toString() ; 
27) ? 

28) } 


在 类 or 中 , 方法 jumping( 第 5~10 行 ) 生 成 了 一 个 布尔 表达 式 B=Bi || By 的 跳 转 代码 。 
当前 假设 BY true 出 口 t 和 false HO £ 都 不 是 特殊 标号 0。 因 为 如 果 Bi HA, B 必然 为 真 , 所 
以 Bi 的 true 出 口 必然 是 t, 而 它 的 false 出 口 对 应 于 B, 的 第 一 条 指令 。B; 的 true 和 false 出 口 和 
B 的 相应 出 口 相 同 。 


1) package inter; // 文件 Or.java 

2) import lexer.*; import symbols.*; 

3) public class Or extends Logical { 

4) public Or(Token tok, Expr x1, Expr x2) { super(tok, x1, x2); } 
5) public void jumping(int t, int f) { 


6) int label = t != 0 7 t : newlabel(); 
T) expri.jumping(label, 0); 

8) expr2.jumping(t,f); 

9) if( t == 0 ) emitlabel(label); 

10) 让 

11) } 


在 一 般 情况 下 , B 的 true HO t 可 能 是 特殊 标号 0。 变 量 label (3c Or. java 的 第 6 行 ) 
保证 了 Bi 的 true 出 口 被 正确 地 设置 为 B 的 代码 的 结尾 处 。 如 果 t HO, 那么 label 被 设置 为 一 
个 新 的 标号 , 并 在 B 和 B, 的 代码 被 生成 后 再 生成 这 个 新 标号 。 

类 and 的 代码 和 Or 的 代码 类 似 。 


1) package inter; // 文件 And.java 
2) import lexer.*; import symbols.*; 
3) public class And extends Logical { 
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4) public And(Token tok, Expr x1, Expr x2) { super(tok, x1, x2); } 
5) public void jumping(int t, int f) { 


6) int label = f '= 0 ? f : newlabel(); 
7) expri.jumping(0, label); 

8) expr2.jumping(t,f); 

9) if( f == 0 ) emitlabel(label); 

10) } 

11) } 


虽然 类 Not 实现 的 是 一 个 单 目 运算 符 , 这 个 类 和 其 他 布尔 运算 符 之 间 仍 然 具 有 相当 多 的 共同 之 
处 , 因此 我 们 把 它 作为 Logical 的 一 个 子 类 。 它 的 超 类 具有 两 个 运算 分 量 , 因此 在 第 4 行 对 super 
的 调用 中 x2 出 现 了 两 次 。 在 第 5 ~6 行 的 方法 中 , 只 有 expr2( 文 件 Logical: java 的 第 4 行 上 声 
明 ) 被 用 到 。 在 第 5 行 , 方法 jumping 仅仅 把 true 出 口 和 false HOXH, 调用 expr2.jumping。 

1) package inter; // 文件 Not.java 
be class Not extends Logical { 
public Not(Token tok, Expr x2) { super(tok, x2, x2); } 
) 


public void jumping(int t, int f) { expr2.jumping(f, t); } 
public String toString() { return op.toString()+" "+expr2.toString(); } 


26 Rel 实现 了 运算 符 <、< =、= =、1 =. >= MM >, BA check( #5 ~9 77) HAW 
运算 分 量 是 否 具有 相同 的 类 型 , 但 它们 不 是 数组 类 型 。 为 简单 起 见 ,， 这 里 不 允许 类 型 强制 转换 。 


1) package inter; // 文件 Rel.java 


) 

3) public class Rel extends Logical { 

4) public Rel(Token tok, Expr x1, Expr x2) { super(tok, xi, x2); } 
5) public Type check(Type pi, Type p2) { 

6) if ( pl instanceof Array || p2 instanceof Array ) return null; 
7) else if( pi == p2 ) return Type.Bool; 

8) else return null; 

9) 出 
10) public void jumping(int t, int f) { 
11) Expr a = expri.reduce(); 
12) Expr b = expr2.reduce(); 
13) 

String test = a.toString() + " " + op.toString() + " " + b.toString(); 

14) emitjumps(test, t, f); 
15) a 
16) } 


方法 jumping ( 3Cf Rel. java 的 第 10 ~ 15 行 ) 首 先 为 子 表达 式 exprl Al expr2 生成 代码 (第 
11 ~12 行 )。 然 后 它 调用 方法 emitjumps, 这 个 方法 在 AS 节 的 文件 Expr. java 中 的 第 10 ~ 18 
行 中 定义 。 如 果 t 和 f 都 不 是 特殊 标号 0, 那么 emitjumps 执行 下 列 代 码 : 


12) emit("if "+ test + " goto L" + t); // 文件 Erpr.java 

13) emit("goto L" + f); 

WMR t Ml 是 特殊 标号 0, 那么 最 多 只 会 生成 一 个 指令 (同样 是 来 自 文件 Expr. java): 
15j else if( t != 0 ) emit("if " + test + " goto L" + t)i 

16) else if(. f != 0 ) emit("iffalse " + test + " goto L" + f); 

17) else ; // 不 生成 指令 ， 因 为 t 和 f 都 直接 穿越 


在 生成 类 Access 的 代码 时 演示 了 方法 emitjumps 的 另 一 种 用 法 。 源 语言 允许 把 布尔 值 赋 
给 标识 符 和 数组 元 素 , 因此 一 个 布尔 表达 式 可 能 是 一 个 数组 访问 。 类 Access 有 一 个 方法 gen， 
用 来 生成 “正常 ”代码 , 另 一 个 方法 jumping 用 来 生成 跳 转 代 码 。 方 法 jumping(# 11 íF) EWE 
这 个 数组 访问 归 约 为 一 个 临时 变量 后 调用 emitjumps。 这 个 类 的 构造 函数 (第 6~9 行 ) 被 调用 
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时 的 参数 为 一 个 平坦 化 的 数组 a、 一 个 下 标 i 和 该 数组 的 元 素 类 型 po 在 生成 数组 地 址 计算 代码 
的 过 程 中 完成 了 类 型 检查 。 


1) package inter; // 文件 Access.java 
2) import lexer.*; import symbols.*; 

3) public class Access extends Op { 

4) public Id array; 


5) public Expr index; 
6) public Access(Id a, Expr i, Type p) { // p 是 将 数组 平坦 化 后 的 元 素 类 型 


7) super(new Word("[]", Tag. INDEX), p); 

8) array = a; index = is 

9) 

10) public Expr gen() { return new Access(array, index.reduce(), type); } 
11) public void jumping(int t,int Per emitjumps (reduce () .toString() ,t,f); $ 
12) public String toString() { 

13) return array.toString() + " [ " + index.toString() + " te; 

14) } 

15) } 


跳 转 代码 还 可 以 被 用 来 返回 一 个 布尔 值 。 本 节 中 较 早 描述 的 类 Logical 有 一 个 方法 gen 
(第 15 ~24 行 ) 。 这 个 方法 返回 一 个 临时 变量 temp。 这 个 变量 的 值 由 这 个 表达 式 的 跳 转 代码 中 
的 控制 流 决定 。 在 这 个 布尔 表达 式 的 true HO, temp 被 赋予 true 值 ; 在 false H H , temp 被 赋 
予 false 值 。 这 个 临时 变量 在 第 17 行 声明 。 这 个 表达 式 的 跳 转 代码 在 第 18 ITER, 其 中 的 true 
出 口 是 下 一 条 指令 , 而 false 出 口 是 一 个 新 标号 Eo 下 一 条 指令 把 true EMRA temp( 第 19 行 )， 
后 面 紧 跟 目标 为 新 标号 a 的 跳 转 指令 (第 20 行 )。 第 21 行 上 的 代码 生成 标号 £ 和 一 个 把 false 
WRIA temp 的 指令 。 这 个 代码 片段 的 结尾 是 标号 a， 该 标号 在 第 22 FER. BUA, gen 返回 temp 
(第 23 行 )。 


A.7 语句 的 中 间 代 码 


每 个 语句 构造 被 实现 为 Stmt 的 一 个 子 类 。 一 个 构造 的 组 成 部 分 对 应 的 字段 是 相应 子 类 的 
对 象 。 例 如 ,如 我 们 将 看 到 的 , 类 While 有 一 个 对 应 于 测试 表达 式 的 字段 和 一 个 子 语句 字段 。 

下 面 的 类 Stmt 的 代码 中 的 第 3 ~4 行 处 理 抽象 语法 树 的 构造 。 构 造 函 数 Stmt ( ) 不 做 任何 
事情 , 因为 相关 处 理工 作 是 在 子 类 中 完成 的 。 静态 对 象 Stmt .Null (54 行 ) 表 示 一 个 空 的 语句 
序列 。 


1) package inter; // 文件 Stmt.java 

2) public class Stmt extends Node { 

3) public Stmt() { } 

4) public static Stmt Null = new Stmt(); 

5) public void gen(int b, int a) {} // 调用 时 的 参数 是 语句 开始 处 的 标号 和 语句 的 下 一 条 指令 的 标号 


6) int after = 0; // 保存 语句 的 下 一 条 指令 的 标号 
7) public static Stmt Enclosing = Stmt.Null; // 用 于 break 语句 
8) } 


第 5 ~7 行 处 理 三 地 址 代码 的 生成 。 方 法 gen 被 调用 时 两 个 参数 分 别 是 标号 a Ab, 其 中 b 
标记 这 个 语句 的 代码 的 开始 处 , 而 a 标记 这 个 语句 的 代码 之 后 的 第 一 条 指令 。 方法 gen( 第 5 
行 ) 是 子 类 中 的 gen 方法 的 占 位 符 。 子 类 While 和 Do 把 它们 的 标号 a 存放 在 字段 after( 第 6 
行 ) 中 。 当 任何 内 层 的 break 语句 要 跳出 这 个 外 层 构 造 时 就 可 以 使 用 这 些 标号 。 对 象 St- 
nt. Enclosing 在 语法 分 析 时 被 用 于 跟踪 外 层 构 造 。( 对 于 包含 continue 语句 的 源 语言 , 我 
们 可 以 使 用 同样 的 方法 来 跟踪 一 个 continue 语句 的 外 层 构造 。) 

类 IE 的 构造 函数 为 语句 认 ( E ) 5 构造 一 个 结 点 。 字段 expr 和 stmt 分 别 保存 也 和 5 对 
应 的 结 点 。 请 注意 , 小 写字 母 组 成 的 expr 是 一 个 类 Expr 的 字段 的 名 字 。 类 似 地 , stmt 是 类 为 


622 附录 A 








Stmt 的 字段 的 名 字 。 
1) package inter; // 文件 If.java 
2) import symbols.*; 
3) public class If extends Stmt { 
4) Expr expr; Stmt stmt; 
5) public If(Expr x, Stmt s) { 


6) expr = x; stmt = 8; 

7) if( expr.type != Type.Bool ) expr.error("boolean required in if"); 
8) 于 

9) public void gen(int b, int a) { 

10) int label = newlabel(); // stmt 的 代码 的 标号 

11) expr.jumping(0, a); // 为 真 时 控制 流 穿 越 ， 为 假 时 转向 a 

12) emitlabel(label); stmt.gen(label, a); 

£5) 0) 

14) } 


一 个 If 对 象 的 代码 包含 了 expr 的 跳 转 代 码 , 然后 是 stmt 的 代码 。 如 A.6 节 中 所 讨论 的 ， 
第 11 行 的 调用 expr. jumping(0,a) 指 明 如 果 expr 的 值 为 真 , 控制 流 必须 穿越 expr 的 代码 ; 
否则 控制 流 必须 转向 标号 a。 

类 Else 处 理 条件 语 句 的 else 部 分 。 它 的 实现 和 类 LE 的 实现 类 似 : 


1) package inter; // 文件 Else.java 
2) import symbols.*; 

3) public class Else extends Stmt { 

4) Expr expr; Stmt stmti, stmt2; 

5) public Else(Expr x, Stmt si, Stmt s2) { 


6) expr = x; stmti = si; stmt2 = s2; 

7) if( expr.type != Type.Bool ) expr.error("boolean required in if"); 
S 

9) public void gen(int b, int a) { 

10) int label1 = newlabel(); // labeli 用 于 语句 stmt1 

11) int label2 = newlabel(); // labe12 用 于 语句 stmt2 

12) expr. jumping(0,label2) ; // 为 真 时 控制 流 穿越 到 stmt 1 

13) emitlabel(label1); stmt1.gen(label1, a); emit("goto L" + a); 
14) emitlabel(label2); stmt2.gen(label2, a); 

15) $ 

16) } 


一 个 While 对 象 的 构造 过 程 分 为 两 个 部 分 :构造 函数 While( ) 创 建 了 一 个 子 结 点 为 空 的 结 点 
(第 5 行 ); 初始 化 函数 int (x,s) 把 子 结 点 expr 设置 成 为 x, 把 子 结 点 stmt 设置 成 为 s( 第 6 ~9 
行 )。 函 数 gen(b,a) 用 于 生成 三 地 址 代码 (第 10 ~16 行 )。 它 和 类 If 中 的 相应 函数 gen( ) 在 本 质 
上 有 着 相通 之 处 。 不 同 之 处 在 于 标号 a 被 保存 在 字段 after ($8114), A stmt 的 代码 之 后 紧 
跟着 一 个 目标 为 b 的 跳 转 指令 (第 15 行 ) 。 这 个 指令 使 得 while 循环 进入 下 一 次 迭代 ， 


1) package inter; // 文件 While.java 
2) import symbols.*; 

3) public class While extends Stmt { 

4) Expr expr; Stmt stmt; 

5) public While() { expr = null; stmt = null; } 
6) public void init(Expr x, Stmt s) { 


T) expr = x; stmt. = s; 

: if( expr.type != Type.Bool ) expr.error("boolean required in while"); 
9 } 

10) public void gen(int b, int a) { 

11) after = a; // 保存 标号 a 

12) expr. jumping(0, a); 

13) int label = newlabel(); // 用 于 stmt 的 标号 

14) emitlabel(label); stmt.gen(label, b); 

15) emit("goto L" + b); 

16) } 


一 个 完整 的 编译 器 前 端 本 5 





类 Do AIA While 非常 相似 。 


1) package inter; // 文件 Do.java 
2) import symbols.*; 

3) public class Do extends Stmt { 

4) Expr expr; Stmt stmt; 

5) public Do() { expr = null; stmt = null; } 
6) public void init(Stmt s, Expr x) { 


7) expr = x; stmt = s; 

8) if( expr.type != Type.Bool ) expr.error("boolean required in do"); 
9) 出 

10) public void gen(int b, int a) { 

i) after = a; 

12) int label = newlabel(); // 用 于 expr 的 标号 
13) stmt .gen(b, label); 

14) emitlabel (label) ; 

15) expr. jumping(b,0); 

16) 时 

LOG 


类 set 实现 了 左 部 为 标识 符 且 右 部 为 一 个 表达 式 的 赋值 语句 。 在 类 Set 中 的 大 部 分 代码 的 
目的 是 构造 一 个 结 点 并 进行 类 型 检查 (第 5 ~ 13 行 )。 函 数 gen 生成 一 个 三 地 址 指令 (第 14 
全 16 47) o 

1) package inter; // 文件 Set.java 
2) import lexer.*; import symbols. *; 
3) public class Set extends Stmt { 


4) public Id id; public Expr expr; 
5) public Set(Id i, Expr x) { 


6) id = i; expr = x; 

7) if ( check(id.type, expr.type) == null ) error("type error"); 
8) } 

9) public Type check(Type pi, Type p2) { 
10) if ( Type.numeric(p1) && Type.numeric(p2) ) return p2; 
11) else if ( pl == Type.Bool && p2 == Type.Bool ) return p2; 
12) else return null; 
13) l 
14) public void gen(int b, int a) { 
15) emit( id.toString() + "=" + expr.gen().toString() ); 
16) } 
PAP 
类 SetElem 实现 了 对 数组 元 素 的 赋值 。 

1) package inter; // 文件 SetElem.java 


2) import lexer.*; import symbols.*; 

3) public class SetElem extends Stmt { 

4) public Id array; public Expr index; public Expr expr; 
5) public SetElem(Access x, Expr y) { 


6) array = x.array; index = x.index; expr = y; 

7) if ( check(x.type, expr.type) == null ) error("type error"); 
8) Bi 

9) public Type check(Type pi, Type p2) { 

10) if ( pi instanceof Array || p2 instanceof Array ) return null; 
11) else if ( p1 == p2 ) return p2; 

12) else if ( Type-numeric(p1) && Type.numeric(p2) ) return p2; 
13) else return null; 

w | 7 

15) public void gen(int b, int a) { 

16) String si = index.reduce().toString(); 

17) String s2 = expr.reduce().toString(); 

18) emit(array.toString() +" [." + si+" ] =" + s2); 

19) 上 
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类 Seq 实现 了 一 个 语句 序列 。 在 第 6 ~7 行 上 对 空 语句 的 测试 是 为 了 避免 使 用 标号 ;请 注 
意 , 空 语句 Stmt . Null 不 会 产生 任何 代码 , 因为 类 stmt 中 的 方法 gen 不 做 任何 处 理 。 


1) package inter; // 文件 Seq.java 

2) public class Seq extends Stmt { 

3) Stmt stmt1; Stmt stmt2; 

4) public Seq(Stmt si, Stmt s2) { stmti = si; stmt2 = s2; } 
5) public void gen(int b, int a) { 


6) if ( stmt1 == Stmt.Null ) stmt2.gen(b, a); 

7) else if ( stmt2 == Stmt.Null ) stmti.gen(b, a); 
8) else { 

9) int label = newlabel(); 

10) stmti.gen(b, label) ; 

11) emitlabel (label) ; 

12) stmt2.gen(label,a); 

13) } 

wW 3 

15) } 


一 个 break 语句 把 控制 流转 出 它 的 外 围 循环 或 外 围 switch 语句 。 类 Break 使 用 字段 stmt 来 
保存 它 的 外 围 语 名 构造 (语法 分 析 器 保证 Stmt . Enclosing 表示 了 其 外 围 构造 对 应 的 语法 树 结 
点 )。 一 个 Break 对 象 的 代码 是 一 个 目标 为 标号 stmt. after 的 跳 转 指令 。 这 个 标号 标记 了 紧 
跟 在 stmt 的 代码 之 后 的 指令 。 


1) package inter; // 文件 Break.java 
2) public class Break extends Stmt { 

3) Stmt stmt; 

4) public Break() { 

5) if( Stmt.Enclosing ==Stmt. null ) error("unenclosed break") ; 
6) stmt = Stmt.Enclosing; 

7) } 

8) public void gen(int b, int a) { 

9) emit( "goto L" + stmt.after); 

10) 

11) } 


A.8 语法 分 析 器 


语法 分 析 器 读 人 一 个 由 词法 单元 组 成 的 流 ,并 调用 适当 的 在 A.5 ~ A.7 节 中 讨论 的 构造 函 
构建 出 一 棵 抽象 语法 树 。 当 前 符号 表 按照 2.7 节 中 图 2.38 的 翻译 方案 进行 处 理 。 


包 parser 包含 一 个 类 Parser: 


1) package parser; // 文件 Parser.java 

2) import java.io.*; import lexer.*; import symbols.*; import inter.*; 
3) public class Parser { 

4) private Lexer lex; // 这 个 语法 分 析 器 的 词法 分 析 器 

5) private Token look; // 向 前 看 词法 单元 

6) Env top = null; // 当前 或 顶层 的 符号 表 

7) int used = 0; // 用 于 变量 声明 的 存储 位 置 

8) public Parser(Lexer 1) throws TOException { lex = 1; move(); } 
9) void move() throws IOException { look = lex.scan(); } 


数 


> 


10) void error(String s) { throw new Error("near line "+lex.line+": PPD so} 
11) void match(int t) throws IOException { 

12) if( look.tag == t ) move(); 

13) else error("syntax error"); 

14) 3} 


和 2.5 节 中 的 简单 表达 式 的 翻译 器 类 似 , 类 Parser 对 每 个 非 终结 符号 有 一 个 过 程 。 消 除 
A.1 节 中 源 语言 文法 中 的 左 递归 后 可 以 得 到 一 个 新 的 文法 。 这 些 过 程 就 是 基于 这 个 新 文法 创 
建 的 。 
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语法 分 析 过 程 首先 调用 了 过 程 program, 这 个 过 程 又 调用 了 plock( ) (第 16 行 ) 来 对 输入 
流 进行 语法 分 析 , 并 构建 出 抽象 语法 树 。 第 17 ~ 18 行 生 成 了 中 间 代 码 。 


15) public void program() throws IOException { // program -> block 


16) Stmt s = block(); 

17) int begin = s.newlabel(); int after = s.newlabel(); 

18) s.emitlabel(begin); s.gen(begin, after); s.emitlabel(after) ; 
19) 3 


对 符号 表 的 处 理 明确 显示 在 过 程 Dlock HO, AE top( 在 第 5 行 中 声明 ) 存放 了 最 顶层 的 
符号 表 ,变量 savedEnv( 第 21 行 ) 是 一 个 指向 前 面 的 符号 表 的 连接 。 


20)  Stmt block() throws IOException { // block -> { decls stmts } 


21) match(’{’); Env savedEnv = top; top = new Env(top); 
22) decls(); Stmt s = stmts(); 

23) match(’}’); top = savedEnv; 

24) return s; 

25) } 


程序 中 的 声明 会 被 处 理 为 符号 表 中 有 关 标 识 符 的 条 目 ( 见 第 30 47) 0 虽然 这 里 没有 显示 , E 
明 还 可 能 生成 在 运行 时 刻 为 标识 符 保留 存储 空间 的 指令 。 


26) void decls() throws I0Exception { 


27) while( look.tag == Tag.BASIC ) { // D -> type ID ; 

28) Type p = type(); Token tok = look; match(Tag.ID); match(’;’); 
29) Id id = new Id((Word)tok, p, used); 

30) top.put( tok, id ); 

31) used = used + p.width; 

32) F 

33) 二 

34) Type type() throws I0Exception { 

35) Type p = (Type)1ook; // 期 望 1ook.tag == Tag.BASIC 
36) match(Tag.BASIC) ; 

37) if( look.tag != ’[’ ) return p; // T -> basic 

38) else return dims(p); // 返回 数组 类 型 

39) } 

40) Type dims(Type p) throws IOException { 

41) match(’[’); Token tok = look; match(Tag.NUM); match(’]’); 
42) if( look.tag == ’[’ ) 

43) p = dims(p); 

an return new Array(((Num)tok).value, p); 

45 } 


WE stmt 有 一 个 switch 语句 。 这 个 语句 的 各 个 case 分 支 对 应 于 非 终结 符号 Stmt 的 各 个 产 
生 式 。 每 个 case 分 支 都 使 用 A. 7 节 中 讨论 的 构造 函数 来 建立 某 个 构造 对 应 的 结 点 。 当 语法 分 析 
器 碰 到 while 语句 和 do 语句 的 开始 关键 字 的 时 候 , 就 会 创建 这 些 语句 的 结 点 。 这 些 结 点 在 相应 语 
句 进行 完 语法 分 析 之 前 就 构造 出 来 , 这 可 以 使 得 任何 内 层 的 break 语句 回 指 到 它 的 外 层 循环 语 
Al, “SHORE RTE, 我们 通过 使 用 类 stmt 中 的 变量 Stmt. Enclosing 和 savedStmt 
(在 第 52 行 声 明 ) 来 保存 当前 的 外 层 循环 的 。 


46) Stmt stmts() throws IOException { 


47) if ( look.tag == ’}’ ) return Stmt.Null; 

48) else return new Seq(stmt(), stmts()); 

49) 

50) Stmt stmt() throws IOException { 

51) Expr x; Stnt s, si, s2; 

52) Stmt savedStmt; // 用 于 为 break 语 句 保存 外 层 的 循环 语句 





o 另 一 种 很 具有 吸引 力 的 方法 是 向 类 Env 中 添加 方法 push 和 pop, 而 当前 的 符号 表 可 以 通过 一 个 静态 变 
量 Env .top 来 访问 。 


/ 
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53) switch( look.tag ) { 
54) case ?*: 
55) move() ; 
56) return Stmt,Null; 
57) case Tag. IF: 
58) match(Tag.IF); match” C); x = bool(); match(’)?); 
59) si = stmt(); 
60) if( look.tag != Tag.ELSE ) return new If(x, s1); 
61) match(Tag.ELSE) ; 
62) s2 = stmt(); 
63) return new Else(x, si, s2); 
64) case Tag.WHILE: 
65) While whilenode = new While(); 
66) savedStmt = Stmt.Enclosing; Stmt.Enclosing = whilenode; 
67) match(Tag.WHILE); match(’(’); x = bool() ; match(’)’); 
68) si = stmt(); 
69) whilenode.init(x, s1); 
70) Stmt.Enclosing = savedStmt; // 重 置 Stmt ,Enclosing 
71) return whilenode; 
72) case Tag.D0: 
73) Do donode = new Do(); 
74) savedStmt = Stmt.Enclosing; Stmt.Enclosing = donode; 
75) match(Tag.DO); 
76) si = stmt(); 
77) match(Tag.WHILE); match(’(’); x = bool(); match(’)’); match(’;’); 
78) donode.init(si, x); 
79) Stmt.Enclosing = savedStmt; // HM Stmt.Enclosing 
80) return donode; 
81) case Tag.BREAK: 
82) match(Tag.BREAK); match(’;’); 
83) return new Break(); 
84) case ’{’: 
85) return block(); 
86) default: 
87) return assign(); 
88) i 
$9) 9 


为 方便 起 见 , 赋值 语句 的 代码 出 现在 一 个 辅助 过 程 assign 中 。 


90) Stmt assign() throws I0Exception { 


91) Stmt stmt; Token t = look; 

92) match(Tag. ID); 

93) Id id = top.get(t); 

94) if( id == null ) error(t.toString() + " undeclared"); 
95) if( look.tag == °=?’ ) { fS => id = E 5 
96) move(); stmt = new Set(id, bool()); 

97) } 

98) ‘else { 14S -> LEY 
99) Access x = offset(id); 

100) match(’=’); stmt = new SetElem(x, bool()); 
101) } 

102) match(’;’); 

103) return stmt; 

DO h} 


对 算术 运算 和 布尔 表达 式 的 语法 分 析 很 相似 。 在 每 种 情况 下 都 会 创建 一 个 正确 的 抽象 语法 


树 结 点 。 如 A.5 节 和 A.6 节 所 讨论 的 , 这 两 者 的 代码 生成 方法 有 所 不 同 。 


105) Expr bool() throws IOException { 


106) Expr x = join(); 

107) while( look.tag == Tag.OR ) { 

108) Token tok = look; move(); x = new Or(tok, x, join()); 
109) } 


110) return x; 
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111) 了 

112) Expr join() throws IOException { 

113) Expr x = equality(; 

114) while( look.tag == Tag.AND ) { 

115) Token tok = look; move(); x = new And(tok, x, equality()); 

116) } 

117) return x; 

Ta 

119) Expr equality() throws IOException { 

120) Expr x = rel(); 

121) while( look.tag == Tag.EQ || look.tag == Tag.NE ) { 

122) Token tok = look; move(); x = new Rel(tok, x, rel()); 

123) Ji 

124) return x; b 

Vy oS 

126) Expr rel() throws I0Exception { 

127) Expr x = expr(); 

128) switch( look.tag ) { 

129) case ’<’: case Tag.LE: case Tag.GE: case ’>’: 

130) Token tok = look; move(); return new Rel(tok, x, expr()); 

131) default: 

132) return x; 

133) } 

i3 3 

135) Expr expr() throws IOException { 

136) Expr x = term(); 

137) while( look.tag == ’+’ || look.tag == ’-’ ) { 

138) Token tok = look; move(); x = new Arith(tok, x, term()); 

139) 出 

140) return x; 

141) } 

142) Expr term() throws I0Exception { 

143) Expr x = unary(); 

144) while(look.tag == ’*’ || look.tag == ’/’ ) { 

145) Token tok = look; move(); x = new Arith(tok, x, unary()); 

146) } 

147) return x; 

148) } 

149) Expr unary() throws I0Exception { 

150) if( look.tag == ’-’ ) { 

151) move(); return new Unary(Word.minus, unary()); 

152) } 

153) else if( look.tag == ’!’ ) { 

154) Token tok = look; move(); return new Not(tok, unary()); 

155) } 

156) else return factor(); 

iy} 

在 语法 分 析 器 中 的 其 余 代 码 处 理 表 达 式 “因子”。 辅 助 过 程 offset 按照 6.4.3 节 中 讨论 的 
方法 为 数组 地 址 计算 生成 代码 。 

158) Expr factor() throws I0Exception { 

159) Expr x = null; 

160) switch( look.tag ) { 

161) case ’(’: 

162) move(); x = bool(); match(’)’); 

163) return x; 

164) case Tag.NUM: 

165) x = new Constant(look, Type.Int); move(); return x; 

166) case Tag.REAL: 

167) x = new Constant(look, Type.Float); move(); return x; 

168) case Tag. TRUE: 

169) x = Constant.True; move(); return x; 


170) case Tag.FALSE: 
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171) 
172) 
173) 
174) 
175) 
176) 
177) 
178) 
179) 
180) 
181) 
182) 
BA | 
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x = Constant.False; move(); return x; 
default: 

error("syntax error"); 

return x; 
case Tag.ID: 

String s = look.toString(); 

Id id = top.get (look) ; 

if( id == null ) error(look.toString() + " undeclared"); 

move(); 

if( look.tag != ’[’ ) return id; 

else return offset(id); 


5 


184) Access offset(Id a) throws IOException { // I -> [E] | [E] I 


185) 
186) 
187) 
188) 
189) 
190) 
191) 
192) 
193) 
194) 
195) 
196) 
197) 
198) 
199) 
200) 
301) } 
202) } 


Expr i; Expr w; Expr t1, t2; Expr loc; // 继承 id 
Type type = a.type; 
match(’[’); i = bool(); match(’]’); // $—* Pee, 1->0E] 
type = ((Array)type) .of; 
w = new Constant(type.width); 
ti = new Arith(new Token(’*’), i, w); 
loc = t1; 
while( look.tag == ’[’ ) { // 多 维 下 标 ，I->[E]I 
match(’[’); i = bool(); match(’]’); 
type = ((Array)type) .of; 
w = new Constant(type.width) ; 
t1 = new Arith(new Token(’*’), i, vw); 
= new Arith(new Token(’+’), loc, t1); 
loc = t2; 
} 


return new Access(a, loc, type); 


A.9 创建 前 端 


这 个 编译 器 的 各 个 包 的 代码 存放 在 五 个 目录 中 :main、lexer、symbols、parser 和 in- 
ter, 创建 编译 器 的 命令 行 根据 系统 的 不 同 而 不 同 。 下 面 是 编译 器 的 UNIX 实现 : 


javac lexer/*.java 
javac symbols/*.java 
javac inter/*.java 
javac parser/*.java 
javac main/*.java 


上 面 的 javac 命令 为 每 个 类 创建 了 . class 文件 。 要 练习 使 用 我 们 的 翻译 器 ， 只 需要 输入 
java main. Main, 后 面 跟 上 将 要 被 翻译 的 源 程 序 ， 比 如 文件 test 中 的 内 容 : 


// 文件 test 


2) int i; int j; float v; float x; float[100] a; 
3)  while( true ) { 


4) do i = it+1; while( a[i] < v); 

5) do j = j-1; while( a[j] > v); 

6) if( i >= j ) break; 

7) x = alil; ali] = alj]; alj] = z; 
8) } 

9) } 

对 于 这 个 输入 , 这 个 前 端 输出 : 
LLL: Ls 

2)L5: ti=i*8 

3)? t2 =a [ti] 
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4) if t2 < v goto L3 
ee j sj 

LT: = t8 = 5 * 8 

if) t4 =a [t3] 

8) if t4 > v goto L4 
9) L6: iffalse i >= j goto L8 
10) L9: goto L2 

11)L8: tS =i* 8 

12) x= ja) Cte 

13) L10: teeni * S 

14) t7=j*8 

15) t8 =a [t7] 

16) a [t6 ] = t8 

WY Lit: y t9,= jwe 

18) alt9]=x 

19) goto Li 

20) L2 


附录 B 寻找 线性 独立 解 


找 出 AZDO 的 最 大 的 线性 独立 解 集合 ,并 将 它们 表示 为 矩阵 B 的 各 行 
输入 : 一 个 MxN 的 矩阵 4。 
输出 : HARD 的 各 个 线性 独立 解 组 成 的 矩阵 Bo 
方法 : 算法 以 伪 代码 的 方式 在 下 面 给 出 。 请 注意 ,X[7] 表 示 矩 阵 和 的 第 y 行 , X[y: RRE 


阵 X 的 第 y~z 行 , 而 X[y: zj lu: vj 表示 和 矩阵 了 中 的 第 y~z 行 及 第 ~w 列 的 方块 。 回 
M = AT; 
ba 


B = Inxn; /* 一 个 nxn 的 单元 矩阵 */ 
while ( true ) { 


/* 1. 18M [ro : r’ -1][co :ec -1] 为 一 个 对 角 线 元 素 为 正 的 对 角 和 矩 
RE, FEWE M[r :nj[co : m] = 0。M[r' :nj 为 解 。*/ 
C= ao 
Ce, 
while. (存在 Mr][ol 4 0) (84 
7 一 "和 c 一 c #20) f 
通过 行列 互 换 ， 把 中 心 点 MIrj[a] 移动 到 M[r"][e'] 
把 妃 中 的 第 + 行 和 第 r' 行 互 换 ; 
if ( M[r'J[c’] <0) { 
MI = -1+ Mio 
Blr'] = -1* Bir’); 


for ( row = ro ton) { 
if (row # r' and M[row][c'] 4 0){ 
u = —(M[row][e']/M([r'][c’}); 
M{row] = M[row] +u* M[r’); 
Blrow] = Blrow] + ux Bir’); 


} 


/* 2. RH M[r! :可 之 外 的 一 个 解 ， 这 个 解 一 定 是 
M[ro : r' - 1][eo : m] 的 一 个 非 负 组 合 */ 
找 出 kros... Rei > 0 使 得 
kroM [rolle’ : m] +--+ + ky -1M[r' - 1][e’ : m] > 0; 
if (aR TE— EEL, Loan k. > 0) { 
MI = kroM [ro] +--+ + kr-ıM[r' - 1]; 
NoMoreSoln = false; 
jelse /* M[r' : n] 就 是 全 部 解 */ 
NoMoreSoln = true; 
/* 3. 1E M[ro : rn- [co : m] > 0 */ 
if ( NoMoreSoln ) { /* 424% M[r’ :可 移动 到 Mro : rn - 1] */ 
for (r=r' ton) 
交换 MAU BRN rM rott- r: 
Tn =T0o+n-— r +1;} 


else { /* ETE EREE HR W 
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Tm =n+1; 
for ( col = c' tom ) 
if ( FE M[row]|col] < 0 使 得 row > ro ) 
if ( Æ M[r][col] > 0 使 得 7 > ro ) 
{for (row = ro tor, —1) 
if ( M[row]{col] <0) { 
u = [(—M[row]|[col]/M[r][col]) |; 
M{row] = M[row] + u* M[r]; 
Blrow] = Brow] + u* Blr]; 
ig 
} 
else 
for ( row = rn — 1 to ro step -1 ) 
if ( M[row]|[col] < 0)4{ 
fa = Tn — 1; 
42 M[row] #1 M [rn] 对 换 ; 
4€ Blrow] Al Blrn] 对 换 ; 


} 


/* 4. 使 得 M[ro : ra— Ifi : co— 1) > 0 */ 
for ( row = ro tom -1) 
for ( col =1tocg—1) 
if ( M[row]|[col] < 0 ){ 

选取 一 个 > tE M[r][col] > 0 Er < ro; 
u = [(—M[row]|[col]/M[r][col}) |; 
M{row] = M[row] + u* M[r]; 
Blrow] = Blrow] + u * Bir); 


/* 5. 如 果 有 必要 ， 对 M [rn : nj] 中 的 各 行 重复 处 理 */ 
if (NoMoreSoln or tn > n or tn == To) { 
ABM tn 到 n 各 行 5 
return B; 
$ 
else { 
Cn = m +1; 
for ( col = m to 1 step -1 ) 
if (不 存在 M[r][col] > 0 使 得 > < rn ) { 
Ce Cy — Tt 


交换 M 中 的 第 col 列 和 第 cy 列 ; 


To = Tn} 
Co = Cn; 


